Openlibrary: 「translation_of」を文字列タむトルではなく䜜業IDに倉曎したす

䜜成日 2017幎02月10日  Â·  32コメント  Â·  ゜ヌス: internetarchive/openlibrary

これは難しいかもしれたせんが、長期的には䟡倀があるはずです。 膚倧な数の冗長な䜜業蚘録がありたす。 これらの倚くは、独立した䜜品ずしお誀っお蚘録された翻蚳であり、堎合によっおは、マヌゞする必芁のある異圢の䜜者のスペルの䞋でもありたす。 版の蚘録が「の翻蚳」を瀺しおいる堎合、それはそれが翻蚳された元の䜜品に埓属しおいるべきです。 https://openlibrary.org/authors/OL6848355A/HomerにあるIliadのすべおのバリアント「動䜜」を怜蚎しおください

これが䜕が起こる必芁があるかに぀いおの私のWAGです
最初のステップは、その゜ヌス䜜品に名前を付けるこずです。 それは「叞曞」機胜に隠れおいるため、䞀貫性はありたせんが、これは行われおいたす。
2぀目は、察応する゜ヌス䜜業IDが存圚するかどうかを確認するこずです。 存圚する堎合は、その゜ヌス䜜業レコヌドをリンクする必芁がありたす。 source-workレコヌドが存圚しない堎合は、既存のtranslation-workレコヌドのタむトルを「translationof」文字列に䞀臎するように倉曎する必芁がありたす。 最終的に、1぀の゜ヌス䜜業のすべおの翻蚳は、その1぀の゜ヌス䜜業レコヌドに埓属する必芁がありたす。 次に、翻蚳䜜業蚘録を削陀するか、䜕らかの方法で翻蚳者名を取埗するように倉換する必芁がありたす。 結局のずころ、翻蚳は創造的な努力であり、その補品は独立しお著䜜暩の察象ずなりたす。

Data Librarians UI Triage Feature Request merging metadata

党おのコメント32件

@382ず367は関連しおいたす

関連するディスカッションスレッドはhttp://www.mail-archive.com/[email protected]/msg00965.htmlにありたす。

@mekarpelesコメントしおくれたせんか

@LeadSongDogタグありがずうございたす ImportBotの改善を終えたらすぐにこれに察応しようず思いたすこれにより、Open Libraryに最倧10䞇の読み取り可胜なアむテムがもたらされるこずを願っおいたす。 おそらく今週末。 圌が量り蟌みたい堎合に備えお、@ horncもccしたす。

@LeadSongDogに改めお感謝したす。 このスレッドでは倚くのこずが起こっおいたす。

メヌリングリストぞの応答
1 @bfallingず私は、WorkペヌゞずEditionペヌゞをいくらか統合するこずを目指しおいたす。 URL構造は同じように芋えたすが、ナヌザヌ゚クスペリ゚ンスから、どの゚ディションおよびそのデヌタが遞択/アクティブであるかを倉曎できるワヌクペヌゞに垞に衚瀺されたす。
2䜜品のタむトルを英語で維持するこずは実甚的なアむデアだず思いたす。 反察の考えはありたすか @ hornc 、 @ tfmorris 、@ dvanduzer
3゚ディションのタむトルを母囜語/゚ンコヌディングで維持するこずに郚分的です

線集元の翻蚳ぞのリンクがある堎合がある隠された「ラむブラリアン」機胜ずは䜕ですか

私は、翻蚳に䞇胜のルヌルがあるずは思いたせん。 「正しい」答えに最も近いのは、おそらく最初に公開されたバヌゞョンです。 叀代からの文孊は、この芏則の重芁な䟋倖です。 ホメロス、プラトン、たたは聖曞のほずんどの代替翻蚳には、それらすべおを1぀の䜜品にたずめたくないほどの十分なオリゞナルの奚孊金が含たれおいたす。

厳密に蚀えば、䜜品はすでにクラッゞであるため、䜜品にタむトル情報を保存する必芁はありたせん。 ガルシアマルケスのCienAñosdeSoledadに぀いお話しおいる堎合でも、Intro to Calculusの第4版および最新版に぀いお話しおいる堎合でも、垞に正芏版がありたす。 Workオブゞェクトがあるず、UIを開発するのに䟿利です。 ハヌドカバヌかペヌパヌバックか、ギャレヌコピヌか䜜者のタむプラむタヌか、パピルスのどの断片に䜜品の本質が含たれおいるかずいう圢而䞊孊を捉えようずしおも意味がありたせん。別の蚀い方をすれば、䜜品には「1ペヌゞ」から「1ペヌゞ」に私たちを連れお行く以倖に䜕もしないでください-本たたは電子ブックを本に具䜓化するこず。

「の翻蚳」や「の改蚂」などの関係が可換で掚移的である堎合は必ずしも明確ではないため、これはさらに耇雑になりたす。 「オヌディオブック」や「転写」のようなものは、さらに耇雑な䞀方向の関係を持っおいたす。

したがっお、2に぀いおは、今のずころWorkの䞋に正芏のタむトルを保存する䟿利さを維持するこずは確かに実甚的です。 将来のりィッシュリストは、垞にナヌザヌのロケヌルに基づいおタむトルを衚瀺し、ナヌザヌのロケヌルず異なる堎合は垞に元の蚀語のタむトルを含めるこずです。

確かに、二次的著䜜物はオリゞナルよりもかなり優れおいるこずがよくありたすが、「䜜者」は、明らかにオリゞナルのものであるず私は思いたす。 翻蚳者、線集者、およびその他の寄皿者は、実際に混同されるべきではありたせん。 最初に発行された版を特定するこずは、簡単に自動化できる単玔なルヌルだず思いたす。 英語以倖の゚ントリの堎合、PubMedは英語のタむトルおよびその他のメタデヌタず元の蚀語の単語のタむトルの䞡方を保存するこずに泚意しおください。 これは、英語化のバリ゚ヌションの圱響を受けたすが、堅牢なアプロヌチです。

翻蚳がどのように扱われるべきかに぀いおの議論の私の理解を凝瞮しようずしおいたす

  1. 翻蚳版はオリゞナル䜜品の版である必芁がありたす
  2. 翻蚳された䜜業蚘録はすべお元の䜜業ずマヌゞする必芁がありたす぀たり、リダむレクトになり、すべおの゚ディションを元の䜜業に移動したす

したがっお、translation_ofフィヌルドは必芁ありたせんか 正しく蚭定されたtranslated_fromラむブラリアンモヌド、理想的には翻蚳者の圹割。

これは、寄皿者の䞋に翻蚳者を衚瀺するために蚭定した䟋であり、゚ディションは英語で曞かれおおり、叀代ギリシャ語から翻蚳されおいたす。 https://openlibrary.org/books/OL18836004M/The_Iliad

䜜品のタむトルが英語であるずいうこずに関しおは、それは倧䞈倫なデフォルトだず思いたす。たずえば、䞀般的な英語のタむトルを䜿甚した叀兞的なギリシャ語ずラテン語の䜜品には満足しおいたす。 実際、私は、英語のタむトルは、ギリシャ語のアルファベットで元のギリシャ語のタむトルを詊すよりも䞀般的に圹立぀ず䞻匵したす。 ただし、ポリシヌの問題ずしお、フランス語、ロシア語、タむ語、たたはアラビア語の元の䜜品のタむトルを必ずしも英語に倉曎する必芁はないず思いたす。 䜜品のタむトルは、その䜜品で䞀般的に囜際的に認められおいるタむトルであるずいうのがルヌルだず思いたす。 耇数の候補者がいる堎合、著者の堎合は「別名」セクションが必芁になるかもしれたせん。

translation_ofフィヌルドを削陀/無芖し、 is_translationフィヌルドに正しく入力するように努めるこずを提案したす。

マヌゞの実行を支揎するために䞀時的にtranslation_ofに䜜業甚OLIDを入力したい堎合は、実際にはフリヌテキストフィヌルドを䜿甚した堎合ず同じように機胜し、圹立぀可胜性がありたす。 マヌゞを行う方が簡単かもしれたせんが、䜜業マヌゞむンタヌフェむスを䜜成したら。

私は、䜜品が単なるUIの応急修理であるこずに同意したせん。 䟿利なプロパティがたくさんありたす。 私は、OpenLibraryが、䜜品は消耗品であるず考える滑りやすい坂道を䞋り始めるのを芋たくありたせん。

䜜品のタむトルには英語のみが適切だずは思いたせん。 それらはロヌカラむズする必芁がありたす。 䜜品は異なる蚀語で異なる䞀般名を持っおおり、OpenLibraryはそれに察応する必芁がありたす。 ロヌカラむズされた各タむトルにはその蚀語のタグを付ける必芁がありたす。そうすれば、レンダリングコヌドは、ナヌザヌごずに適切なフォヌルバックを遞択できたす。たずえば、英語、フランス語、残りのロマンス諞語、その他の蚀語を遞択できたす。

translation_ofずtranslated_fromの違いがわかりたせん。 それらは私には同矩語のように聞こえたすたたは、䞀方はWorkプロパティで、もう䞀方はEditionプロパティですか。

同じ䜜品に接続されおいるすべおの蚀語の゚ディションが正しい方法です。

Freebaseは、実際には別のオブゞェクトを䜿甚しお翻蚳情報をキャプチャしたした。 Work-Editionリンクに加えお、Translationオブゞェクトに゜ヌス蚀語、タヌゲット蚀語、翻蚳者、および翻蚳日が含たれるWork-Translation-Editionパスもありたした。 これのいく぀かはWork / Editionのペアから掚枬できたすが、倚くの堎合、翻蚳は特定のものずしお語られ、耇数の゚ディションで公開されるこずがよくありたす。 これが必ずしも正しい方法であるず蚀っおいるわけではありたせんが、別のモデリングの代替手段ずしおそれを捚おるこずができたす。

実甚的なデヌタラングリングの芳点から、最初にタむトルをNFC / NFKCに正芏化するず、その埌の比范ず凊理がはるかに簡単になるず思いたした。 http://unicode.org/reports/tr15/#Norm_Forms

申し蚳ありたせんが、甚語はあたり明確ではありたせんが
translation_ofはオリゞナル䜜品のタむトルです
translation_fromは蚀語コヌドです

translation_of:むリアス
translated_from  grc 叀代ギリシャ語1453幎たで

かなり長い間シャルル・ペロヌを打ちのめした埌、「翻蚳」ず「元の蚀語」の線集は完党に無駄な努力であるこずが明らかになりたした。 よく考えられたシステムで起こるべきこずは、線集者が同じ著者の䜜品のリストから1぀を遞ぶこずです。 この䟋では、数癟の゚ディションず数十の翻蚳がありたすが、オリゞナルの䜜品はほずんどありたせん。 耇数の䜜業蚘録が単䞀の䜜業を反映しおいる堎合、リストには、最も線集されたものたたは最初に発行されたもの日付のない蚘録は無芖のいずれかが衚瀺されたす。
䜙談ですが、収集された䜜品をより適切に凊理する必芁性も䟋瀺されおいたす。゚ディションは、さたざたなサブセットを遞択したり、さたざたな著者のストヌリヌをコレクションにたずめたりしたす。 いく぀かのたたは遞択されたものは、最初の出版物である可胜性がありたす。Mmed'Aubreyによる物語は、いく぀かの版で圌のContesdesféesず䞀緒にたずめられおいたす。

@mekarpeles
これず
https://github.com/internetarchive/openlibrary/blob/7195f181742af7389843f275eefb2e675055b727/openlibrary/templates/books/edit/edition.html#L229 -242
おそらくず同様のアプロヌチを採甚する必芁がありたす
https://github.com/internetarchive/openlibrary/blob/7195f181742af7389843f275eefb2e675055b727/openlibrary/templates/books/edit/edition.html#L169 -188

タむトル、他のタむトル、および翻蚳元は、すべお単䞀の䜜品を瀺す方法です。

@cdrini最埌はあなたの仕事でしたね。 このビットも気になりたすか

おそらくこれに察する解決策は、これを「これはどの゚ディションの䜜品ですか」フィヌルドのように動䜜させるこずです。䜜品IDたたは䜜品の固有のタむトルの入力を蚱可しおから、䜜品IDに関連付けられたタむトルを怜玢したす。 IDず俗称の䞡方を保存、玢匕付け、衚瀺する必芁がありたす。
-改蚂たたは単にフィヌルドを削陀しお、意図したずおりに䜜業を䜿甚したす-

@seabelisすでに蚀われおいるこずに加えお、䜕か远加するものはありたすか

たた、 @ hornc 、この問題の担圓者になりたすか 譲受人であるずいうこずは、必ずしもあなたが仕事をする責任があるこずを意味するのではなく、問題に察凊するための情報を収集/提䟛する責任があるこずに泚意しおください。 Wikiから。

割り圓おられた所有者は、必ずしも問題を修正する人ではありたせん問題が修正されるかどうか、たたはい぀修正されるかは、その時点で必ずしも確立されおいるわけではありたせん。問題を凊理するために必芁なものはほずんどありたせん質問、入力の芁請、優先床の確立ず曎新、重耇しおいるかどうかの確認など。

問題に「状態進行䞭の䜜業」ずいうラベルが付けられるず、所有者は䜜業を行っおいる個人、たたは䜜業を行っおいるグルヌプを䞻導/調敎したす。

コンテキストごずにラベルを远加したしたあなたの考えを教えおください

これは、䜜業から自動入力される可胜性があるず思いたす。 おそらく、䜜品には蚀語フィヌルドが必芁です。そうでない堎合は、各゚ディションの元の蚀語を入力する必芁がありたす。これは、理論的には䞍芁です。 これらを管理するための確固たる戊略がないため、マルチワヌク゚ディションでは厄介になる可胜性がありたす。

ただ持っおいない堎合は、䜜業のoriginal_languageが䟿利な远加になりたす。 これにより、 @ horncがtranslated_fromを提案した情報を暗黙的に゚ンコヌドできたす。

@LeadSongDog たたは他の誰かは、珟圚の提案がここにあるものの芁玄を䞎えおいただけたせんか すべおの議論の埌、私は望たしい倉曎が䜕であるかを理解するのに苊劎しおいたす。

おそらくこれに察する解決策は、これを「これはどの䜜品の゚ディションですか」フィヌルドのように動䜜させるこずです。䜜品IDたたは䜜品の固有のタむトルのいずれかを入力できるようにしおから、䜜品IDに関連付けられたタむトルを怜玢したす。 IDず俗称の䞡方を保存、玢匕付け、衚瀺する必芁がありたす。

タむトルが衚瀺されないずいう事実を陀いお、これが「この゚ディションの機胜」フィヌルドの機胜です。 これは、この問題が解決されたこずを意味したすか

@cdriniスレッドの芁玄䜕か芋萜ずした堎合は、他の人がこのコメントを自由に線集しおください。

プレマブル

これを入力するず、この問題をいく぀かの問題に分割するか、 Epicにする必芁があるこずに気付きたした。

元の問題

倚くの翻蚳は、実際には翻蚳元の元の䜜品の゚ディションである必芁があるのに、独自の䜜品です。

珟圚、䜜品のタむトルのフリヌテキストを受け入れるフィヌルドtranslation_ofず、蚀語コヌドを受け入れるフィヌルドtranslation_formがありたす぀たり、叀代ギリシャ語1453幎たでの堎合grc 。

@LeadSongDogは、 translation_ofにWorks olidを受け入れさせお、翻蚳を匷制的に䜜品に関連付けるこずを提案したした。

埌続の問題

  1. 翻蚳が「正芏の䜜業」ず芋なされる堎合や、いく぀かの異なる翻蚳が異なるロケヌルでの「正芏の䜜業」ず芋なされる堎合がありたす。 ぀たり、元の叀代ギリシャ語でオデッセむを読みたいず思う垞連客はほずんどいたせん。

  2. 小説が別の囜で出版されるず、タむトルが倉わる堎合がありたす。 䟋最初のハリヌポッタヌの小説は、英囜ではハリヌポッタヌず賢者の石ず題されおいたすが、米囜ではハリヌポッタヌず賢者の石ず題されおいたす。 これは翻蚳ですか

  3. 翻蚳自䜓に耇数の゚ディションがある堎合がありたす。 えっ

提案された゜リュヌション

  • 翻蚳されたすべおの䜜品を元の䜜品にマヌゞしたす

    • 続いお、 translation_ofにworks_olidを芁求させたす/線集UIの衚瀺はフリヌテキストから機胜し、ナヌザヌが関連する䜜品を遞択できるようにしたす。

  • 䜜品のタむトルはロヌカラむズする必芁がありたす。 そのため、「Communautédel'Anneau」を怜玢するず、「指茪の仲間」の䜜品ペヌゞのロヌカラむズ版が䜜成されたす。
  • すべおの䜜品にはoriginal_languageフィヌルドが必芁です
  • Freebaseの実装ず同様の新しいWork-Translation-Object関係を導入したす

小説が別の囜で出版されるず、タむトルが倉わる堎合がありたす。 䟋最初のハリヌポッタヌの小説は、英囜ではハリヌポッタヌず賢者の石ず題されおいたすが、米囜ではハリヌポッタヌず賢者の石ず題されおいたす。 これは翻蚳ですか

いいえ、翻蚳ではありたせん。 単なるマヌケティングの決定。

゚ディションが元の䜜品に正しくリンクされるず、「translation_of」゚ントリは冗長になりたす。 珟圚、倚くの゚ディションレコヌドは、䜜業レコヌドがないか、間違ったレコヌドにリンクされおいるため、暫定的にデヌタに䟡倀がありたす。 そうは蚀っおも、私の以前の提案はよく考えられおいなかったず思いたす。 @seabelisによるコメントは理にかなっおいたす。それを衚瀺するず、䜜業レコヌドから自動入力されるはずですが、なぜ同じこずを2回蚀う必芁があるのでしょうか。

修正されないので、これを閉じる必芁がありたすか 䜜業蚘録を2回保存するのは冗長に思えるこずに同意したす。

マヌゞフロヌの䜜成805、およびすべおの゚ディションに機胜があるこずの確認2629に぀いおは、他にも問題がありたす

これが最終的に別の問題によっお間接的に解決されるのであれば、それを閉じるこずは問題ないず思いたす。

䞊蚘の2぀の問題によっお間接的に解決されるず思いたす。

@ cdrini 805および2629は、耇数の゚ディションを持぀翻蚳には察応しおいたせん。

たずえば、ホヌマヌのオデッセむには、さたざたな蚀語の䜜品が耇数ありたす。 これらすべおの゚ディションを1぀の䜜品に統合するこずが、これを凊理するための最良の方法ではないず思いたす。

この状況を凊理する最も堅牢な方法は、独自の゚ディションを持぀こずができるが、 Original Workにリンクする必芁があるTranslated Workオブゞェクトを甚意するこずだず思いたす。 ただし、これを実装するのにどれだけの䜜業が必芁かはわかりたせん。

おそらく最も簡単な修正は、Worksペヌゞで゚ディションを怜玢およびフィルタリングできるようにするこずです。

@guyjeangillesスキヌマ内の新しいオブゞェクトぞの扉を開くこずができれば、それは単なる翻蚳以䞊のこずに圹立぀はずです。 䜜業識別子のリストを取埗できる「based_on」など、より䞀般的な回答を怜蚎したす。 そうすれば、翻蚳だけでなく、アン゜ロゞヌ、倧芁、収集された䜜品、翻案などを取り蟌むこずができたす。

@LeadSongDog based_onの実装が簡単な堎合、これにより、コンパニオンガむド、スパヌクノヌト、ボックスセットなどの怜玢結果から関連メディアを陀倖するこずもできたす。 䟋 https //openlibrary.org/searchq = the + hunger + gamesmode = everything

これらの目録基準私がやろうずしおいたに埓えば、すべおの翻蚳は、改䜜やコンパニオンなどがそうではない方法で、元の䜜品に属したす。 https://www.isko.org/cyclo/work1.jpg

翻蚳版の意味を完党に理解しおいるのかわかりたせん。 OL Work-Editionモデルは、衚珟ず衚珟を実際には区別したせん。 これはすべお「゚ディション」ずしおたずめおキャプチャされたす。 これは、元の蚀語の「゚ディション」にも圓おはたりたす。

そうは蚀っおも、ある皋床分離するこずにはメリットがあるず思いたす。 これはトリッキヌであり、翻蚳先週詳现に説明したようにやサむトのナヌザヌの蚀語蚭定を蚭定するだけではありたせん。 たずえば、特定の䜜品のりィキペディアの蚘事に頻繁にリンクしたす。 私は通垞、䜜品の元の蚀語で蚘事にリンクしおいたす。 䜜品が20の蚀語に翻蚳されおいる堎合、りィキペディアだけで20のリンクが存圚する可胜性がありたす。 リストが非垞に長くなるため、远加したせん。 たた、りィキペディアの蚘事は䞀般的に゚ディション固有ではなく、これを耇数の゚ディションに远加したくないため、個々の゚ディションのペヌゞぞのリンクは远加したせん。 これは、他の皮類のリンク、぀たり曞評にも圓おはたりたす。

仕事のレベルで蚀語でフィルタリングする方法があれば、これはナヌザヌにずっお圹立぀ず思いたす。 したがっお、1特定の蚀語の゚ディションのみを衚瀺し、2その蚀語で䜜業レベルのコンテンツを衚瀺したす。 倚くの人が倚蚀語であり、サむトコンテンツの蚭定が母囜語に蚭定されおいおも、耇数の蚀語で読み曞きできるため、これはサむトの蚀語蚭定ずは無関係である必芁がありたすただし、デフォルトの動䜜を確立する必芁がありたす。ナヌザヌは自分の奜みを特定できたす。぀たり、「自動フィルタヌは私の蚀語蚭定で機胜したす」/「ショヌは母囜語で機胜したす」。

@guyjeangillesが瀺唆しおいるように、Translated Workオブゞェクトがあれば、これたたはこのようなものを実珟できたす。
1808に関連したすか

@cdriniは、805も2629も耇数の゚ディションの翻蚳に察応するずは思わないので、これをぶ぀けたす。 おそらく、別の問題を䜜成する必芁がありたすか

議論がかなり長くなったので、私はこれのいく぀かを芋倱ったかもしれたせんが、最終的な決定はtranslation_ofを廃止し、既存の䜜業関係珟圚のシステムがどのように機胜するかを䜿甚するこずだず思いたした正しい䜜業の䞋で翻蚳を移動するための倧芏暡な過去の取り組みがありたす。 この_does_は、耇数の゚ディションがリンクされおいない状態で翻蚳された䜜品を残したす。これは泚目すべき玠晎らしい点だず思いたしたが、これは他の堎所でも受け入れられおいる暙準的な問題のようです。

珟圚のシステムは、翻蚳を独自の䜜品に分離するこずもサポヌトできるず思いたすA.教皇の_Illiad_は、それが完党に正圓化されるず思う私の䟋ですが、䜜品をマヌゞしおから詊行する線集戊争に終わる可胜性があるようです誰もが同意する明確な線を匕くのは難しいので、それらを分割する。 「翻蚳はすべお1぀の䜜業に属したす」は、䜜業が簡単です。

私たちはすでに同じ䜜品の䞋で異なる出版瀟による異なる版を混ぜ合わせおいたす、これは実際にはそれほど違いはありたせん。 蚀語で゚ディションをフィルタリングたたは怜玢する適切な方法があれば、ナヌザヌに圱響を䞎える実際的な問題はおそらく解決されるでしょう。

統合されおいない䜜品に぀いおは、既存のデヌタは保持されたすか

2601はここに関連しおいたす。

このペヌゞは圹に立ちたしたか
0 / 5 - 0 評䟡