太多的作品名称是其他语言的,但如果一个版本是英文的,则应该是英文的(如果所有的都是外语,那也可以,但同时有英文翻译会有所帮助)
我_强烈_不同意该准则。 作品的标题应该(在理想世界中)国际化; 所以英语用户会看到英文标题,而西班牙语用户会看到西班牙语标题。 类似于 Wikidata 处理作品标题的方式: https ://www.wikidata.org/wiki/Q43361
将作品标题设置为原始语言,几乎让每个用户都不满意; 用户讲一本书的_原始_语言的机会有多大? 看到_托尔斯泰_的一本书,却看不懂书名,真是令人沮丧。
我可以从@seabelis @jessamynwest那里得到一些反馈吗? 我想更改该准则。 与此同时,如果存在英文版本(正如@BrittanyBunk 所建议的那样),我们应该将作品名称设为英文。 将来,我们应该扩展我们的数据模型,使其像 Wikidata 一样,以支持具有多个标题(每种语言一个); 但这不必现在就决定。 可能/应该还有一个“原始标题”字段。
@hornc @dcapillae
但是,如果工作页面可以以某种方式对语言进行分组(可能是方面或只是列表排序顺序),那么这将是一个真正的 UI 改进,以便试图找到_Phantoms_ 的德语、土耳其语或西班牙语版本的读者不必翻页通过所有的英语找到它。
@cdrini如果我错了,请纠正我,但似乎 OL 用户仍然无法说出他们的首选语言。 在这个问题得到解决之前,更喜欢该语言的结果仍然是不可能的。 下一个最佳选择是测试浏览器设置,但这通常是不可配置的,例如在公共图书馆信息亭中。
你是对的; 目前无法配置。
并非所有作品都被翻译成英文。
并且有一些关于使用作品填充版本中的“翻译自”字段的讨论,这将要求作品代表原始语言。
一个标题的直译可能不是英文的实际标题,如果一个英文标题有多个版本,会使用哪个?
甚至所有作品的_titles_都没有被翻译成英文。 就此而言,并非每部作品都_有_一个标题。
你好,
其他语言的版本通常包括对原始作品标题的引用。 该值应添加到“翻译”字段中。 这个值只能是一个。
其他语言的版本有时会以不同的标题出版,例如,Ramsey Campbel 的The Nameless以西班牙语出版,有两个不同的标题( La secta sin nombre和Los sin nombre )。 有时原创作品也会以不同的标题出版,例如,杰克芬尼的《身体抢夺者》已经以其他标题(身体抢夺者的入侵)出版。 所有这些标题都可以包含在“其他标题”字段中。 这个值可以不止一个。
如果英文标题有多个版本,我们可以将它们全部包含在“其他标题”字段中。 但是,“翻译的”值只能是一个:只有一个标题和一个翻译它的作品。
@seabelis为了更简洁,这是我提议的更改(只有具有英文版的作品才会在作品中使用英文标题)。
| 之前 | 之后 |
| --- | --- |
| “工作”数据应反映原始语言(如果已知)。 | 如果存在英文版本,则“作品”标题应为英文。 |
这是一个优点/缺点
优点:
缺点:
并且有一些关于使用作品填充版本中的“翻译自”字段的讨论,这将要求作品代表原始语言。
我对那个提议并不疯狂。 我想我宁愿在作品上有一个original_edition
字段,它存储第一个出版物。 那么所有不是该语言的版本都可以假定为该版本的翻译。*
一个标题的直译可能不是英文的实际标题,如果一个英文标题有多个版本,会使用哪个?
我会争辩使用最知名的(如果一个显然更知名的话),否则使用原始的英文标题。 任何其他标题都可以添加到其他标题中(正如@dcapillae建议的那样)。
* 有边缘情况; _理想情况下_我们可以指定一个版本是从哪个特定版本翻译而来的(例如,Ismail Kadare 的书最初是阿尔巴尼亚语的,但大多数非阿尔巴尼亚语版本是法语版本的翻译,而不是原始阿尔巴尼亚语)。 但无论如何我们目前不处理,所以¯\_(ツ)_/¯
这太错误了,我什至不知道从哪里开始。 人们难道没有看到他们正在延续的恶性循环吗?
“大多数用户都是说英语的,所以让我们只用英语做所有事情。”
为什么我们没有更多的非英语使用者? 因为一有机会,我们就会主动让他们感到不受欢迎,把他们赶走!
翻译作品名称绝对是长期的方法,但在我们能够到达那里之前,我们不要倒退到仅限英语的仇外心理。
翻译作品名称绝对是长期的方法,但在我们能够到达那里之前,我们不要倒退到仅限英语的仇外心理。
_强_不同意。 在这种情况发生之前,为什么我们要让几乎每个人的体验都变得糟糕? 同样,这不是反 i18n 或仇外心理,它使我们的数据更有条理。
你能给出一些使用原始语言的工作名称的优点/缺点吗?
@dcapillae _from_ 英语翻译的特殊情况相对简单。 在讨论经典时,它变得更加复杂,在某些情况下,原始文本无法保存。
恰当的例子:我们可以肯定 Aesop 从来没有用英语写作,但 WorldCat 显示这是迄今为止列出的 99 种语言中最常见的翻译语言,而拉丁语远远排在第二位。
https://www.worldcat.org/search?q=Aesop&fq=&dblist=638&fc=ln :_100&qt=show_more_ln%3A&cookie
现存最古老的文本是 1478 部作品集,其中拉丁文的翻译归功于 Rinuccio d'Arezzo,其拉丁文标题为 _Vita et Fabulae_。 我们当然不能确定最早的希腊书名是什么,我们也不能确定这些故事起源于伊索。 我们_可以_做的是识别最早的已知文本,其他文本是从这些文本中派生出来的。 我仍然认为这应该只是一个作品 ID,而不是文本标题。
书名应使用该书所在的语言。完全同意@tfmorris的观点。
互联网档案馆并不是特别擅长与国际观众打交道,我们不要让它变得更糟。
如果我们只是为说英语的用户寻找良好的用户体验(另请参阅,仅在 IA 开放期间获得支持),我们的使命就失败了。 如果我们“标准化”为英语,我们将一组用户优先于另一组用户。
最好的方法是优先考虑添加功能,用户可以设置首选语言。
@jessamynwest我同意 _edition_ 标题应该使用本书的语言; 我们在谈论作品。 您能否提供一些使用英文的工作名称的具体缺点? 还有一些专业人士_特别地_让他们使用原始语言?
澄清一下,我们不是在这里专门讨论 i18n,只是将它作为我们的长期目标牢记在心。 主要问题是作品名称应该是英文还是作品的原始语言。 为了决定这一点,我们需要提出一种与另一种的优缺点。
为什么我们要列出以一种语言_或_另一种语言的作品? 当然,当今世界由英语圈主宰,但没有真正的理由假设每部作品都有一个英文版本,或者一种翻译成英文比另一种更正确。 我们应该有一种机制,可以显示作品的所有不同标题,优先于用户要求的任何语言的标题。
@jessamynwest我同意 _edition_ 标题应该使用本书的语言; 我们在谈论作品。 您能否提供一些使用英文的工作名称的具体缺点? 还有一些专业人士_特别地_让他们使用原始语言?
作品标题的缺点是英文(而不是他们使用的任何语言)
工作标题的优点是英文
想为改变提出理由吗? 显示支持它的数据。 显示用户登陆非英语作品的跳出统计数据。 向我展示那些对不得不处理非英语书籍的非英语标题感到不安的用户的电子邮件。 这是一个数据驱动的网站,那么支持这一点的数据在哪里?
@LeadSongDog
我们应该有一种机制,可以显示作品的所有不同标题,优先于用户要求的任何语言的标题。
强烈同意; 从长远来看,我认为该作品应该列出所有标题(以某种方式)。 这主要是决定在我们有时间处理之前做什么。
@jessamynwest _谢谢您的反馈; 老实说,我很想讨论一下这个问题,但感觉就像“你怎么了?”让我自动关机了。 风格评论。
@LeadSongDog写道:
现存最古老的文本是 1478 部作品集,其中拉丁文的翻译归功于 Rinuccio d'Arezzo,其拉丁文标题为 _Vita et Fabulae_。 我们当然不能确定最早的希腊书名是什么,我们也不能确定这些故事起源于伊索。 我们_可以_做的是识别最早的已知文本,其他文本是从这些文本中派生出来的。
我不是该领域的专家。 图书馆员和档案管理员肯定知道在这些情况下该怎么做。
查阅一些编目手册,他们规定标题的转录必须尊重原始作品的拼写(在这种情况下是保存下来的最古老的书)。 一些手册还指出如何转录原始标题的某些字母,这些字母在旧文件的情况下不直接等同于现代字母。
PS - 为什么我们不在原作旁边放一个黄色的大星星,然后把它浮到顶部呢?
因此,据我所知,格式为:
这一切听起来如何? 感谢大家聚在一起并真正解决问题。 全力以赴真的很棒。
@hornc不知道为什么它有一个紧密的标签,因为其中一些并不难添加。(虽然有些)
翻译标题和翻译作品的标题是有区别的。 直译是非常有问题的。
_Mördare utan ansikte_ 的直译是“没有脸的杀手”; 英文翻译叫做_Faceless Killers_。
_Demons_、_The Devils_ 和 The _Posessed_ 是同一作品的各种英文翻译的标题。
另一方面,_侏罗纪公园_的德语翻译称为_恐龙公园_; _Timeline_ 的西班牙文标题是 _Rescate en el tiempo: (1999-1357)_,翻译回英语为“及时救援”。
所以请清楚你的要求。 显示非英文作品的英文标题(哪个?)或翻译非英文作品的标题。 看来你建议两者。
同意@seabelis。 文字机器翻译不是准确的翻译,在足够多的情况下不会与作品的标题相对应,值得尝试。 这是图书馆事业中我们准确描述为“难题”的事情之一,并且无法通过在其上安装更多计算机来解决。
强烈反对“这只是暂时的”,尤其是当您指的是网站的临时仇外影响时。 暂时的仇外行动仍然是仇外行动。
开放图书馆是一种乐趣,但变化来得很慢,我不赞成进行大规模的改变,“有一天”会被正确的做事方式所取代。 事情应该从一开始就以正确的方式完成(让用户选择他们的语言,在 OL 内容呈现中偏好该语言)。
建成开放图书馆是一个多语言网站,并且在过去十年多的时间里,多语言已经被逐步淘汰。 我们不应该继续这样做。
@seabelis我建议两者,如果有一个,则优先选择非文字标题。 英文标题是什么可能不会被翻译成法文标题。 我想说,当该网站可以为所有人翻译时,它将由母语人士手动输入。 尽管如此,机器应该首先输入直译,这样它就可以先出现,然后用更好的标题进行更正。
@jessamynwest是的。 不过,它不一定要在前端。 它可以在网站的后端,这样当网站可以翻译成各种语言时,可以在其旁边添加该功能。 我只是无法写出所有内容,因为我的回复足够长,如果它们有 20 页以上的长度,没有人会阅读它。
您是否想要具有下拉菜单以显示用户语言的标题翻译的功能? 我想到了这一点,并认为如果通过英文标题的谷歌翻译(因为谷歌翻译不会翻译超过一种语言)是不值得的。 我不是这个网站的开发者,所以不知道会使用什么。 这些只是我的想法。 我不是要制造仇外心理,而是要找到一种解决方案,让每个人都更容易访问该网站(反之亦然)。 似乎避免仇外心理(不仅仅是你)正在为它创造条件(因为你说网站正朝着那个方向前进,如果我们什么都不做,那么它就会保持这种状态或者变得更糟)。
我认为由于这个问题可能比我预期的要大,也许我们应该将翻译与版本分开,因为它创建了一个假设(至少对我来说)所有内容都是从一部作品翻译而来的(有点是,但有点不是)。 就是说,如果我能用我的语言理解该网站,那么我就会知道如何用任何语言来理解该网站。
这些是我的想法,但@jessamynwest你有什么建议? 我只是使用该网站,并对它如何变得更好有自己的想法。 但是我想听听其他人的意见,所以可以解决这个问题。
我提出了我的建议,即我们不按书面形式实现此功能,而是转向实现一个功能,用户可以选择他们的首选语言,这将决定他们如何看待“作品”以及可能向他们显示什么版本。
英语优先的方法是排外的,不好。 也许为“用户可以选择他们的语言”功能打开另一个问题?
也许民族中心主义比仇外心理更好。 反正也不行。
@jessamynwest知道网站最终将如何翻译。 这些是我的方法。
如果你想把它写成一个新问题,那很好(我不是,因为我在这里列出了我的解决方案,这是可以将所有内容保存在一个地方进行修复的地方)。 我只是认为如果它是谷歌翻译方法,它是低效的。
就像我说的,我不是要煽动仇外心理,也不是要以民族为中心,我只是想说应该有一种与语言保持一致的格式,这样每个人都可以有平等的机会。 使用现在的格式,那么它将是英文的(因为网站是英文的,所以这就是一致性)。 我不是说“英语优先”,因为它很棒,这就是要走的路——只是网站使用的是默认语言,如果网站是多种语言,另一个国家的人在翻译网站时会遇到困难。 如果网站是西班牙语的,我会说“西班牙语优先”等以保持一致性。 什么都不做只会让事情变得更糟,而不是更好。 我选择在下面显示原始(和原始图片)的作品,然后是翻译和翻译的图片(使用用户的语言)。 首先是音译,然后手动添加实际翻译(如果不同)。 这是一个好方法吗? 有没有我没有看到的问题?
@BrittanyBunk写道:
我只是想说应该有一种与语言保持一致的格式,这样每个人都可以有平等的访问权限。 使用现在的格式,那么它将是英文的(因为网站是英文的,所以这就是一致性)。
并不真地。 使用现在的格式,“工作”数据应该反映原始语言。 这是一个一致的标准。
@LeadSongDog写道:
我仍然认为这应该只是一个作品 ID,而不是文本标题。
我同意。 事实上,所有作品都有其 Open Library ID。 我们不需要标题来识别它们,因此我们不需要为标题选择首选语言。 原文的作品名称是一个一致的标准。 它与图书馆员使用的相同。
如果所有作品都有自己的 ID,每个作品都是独一无二的,我认为以一种或另一种语言提供标题的问题应该以另一种方式解决,而不是通过人为修改标题或必须为作品名称或开放图书馆网站。 我的意思是,它应该由使用这些 ID 和用户偏好的软件“内部”解决。
无论如何,我同意布列塔尼的观点,即应该努力为最终用户提供更好的体验,以他们的语言提供作品的标题(如果存在,因为在这种情况下音译是一个坏主意),尤其是以改进搜索功能。
PS:我想澄清以下几点:最初的民族中心主义观点可以修改,不一定是坏事。 有时不可避免和无意识,但不一定有问题。 仇外心理绝对是一件坏事。 这就是为什么我建议将“仇外”改为“民族中心”。
@dcapillae我的 2 盒想法如何,将原始作品作为一个盒子,将翻译作为第二个盒子(以及将翻译与版本分开*)? 你说的内部想法是什么? (我很困惑)感谢您的理解 - 这是一种更好的格式,让所有用户都能阅读,而不是应该令人反感的东西。 我就是不能一下子把所有的东西都写出来,否则没人会看的。
我的意思是一种堆叠的方法——比如如果有人点击第二版,其他翻译就会弹出供用户选择。 它可能是另一种形式,只是试图创造想法。
为什么音译是一个坏主意(尤其是如果它被标记为这样)?
对于具有细微差别的材料,例如@seabelis上面提到的书名,机器翻译通常不是一个好主意。 除非有令人信服的理由将不良数据引入方程式,否则我认为它不能解决用户问题。
@jessamynwest这些将被手动更改。 它用于翻译标题,使其更具可读性,并且会有说明说它只是翻译,而不是最准确的标题。 如果没有,你建议读者看看是否没有翻译成他们的语言的书?
我能想到的唯一其他想法是没有机器翻译,只有手动输入。 这意味着它将一无所有。 然后可以添加多个标题及其相应的语言(如@cdrini的图片所示:https://github.com/internetarchive/openlibrary/issues/2601#issuecomment-551230169 - 但它是白俄罗斯标题1,白俄罗斯标题 2 等,如果有更多的一种语言)。
@BrittanyBunk写道:
@dcapillae我的 2 盒想法如何,将原始作品作为一个盒子,将翻译作为第二个盒子(以及将翻译与版本分开*)?
关于其他语言的标题,我认为最重要的是您可以从任何语言的任何标题中搜索作品(和版本)(如果这些标题确实存在,因为它们已经出版)。
两个框是不错的主意,一个带有原始标题的主框,另一个带有用户语言的翻译(如果存在)(可能是版本数量最多的标题),但始终保留原始标题作为主标题。 这是有价值的信息。
对以特定语言发布的版本进行分组的选项(过滤器)也很有帮助。 @LeadSongDog在上面提出了建议。
@BrittanyBunk写道:
你说的内部想法是什么? (我糊涂了)
我也是! :DI 表示不应人为修改数据(例如通过在旁边添加翻译,或更改翻译的原始标题)。 该软件应该能够显示在每种情况下与现有数据相对应的内容:版本名称、作品名称、其他语言的作品名称等。我无法解释如何通过软件解决它,但它会是理想的。
@BrittanyBunk写道:
为什么音译是一个坏主意(尤其是如果它被标记为这样)?
只有真正的书有真正的标题。 开放图书馆是曾经出版的每本书的目录。 音译标题不是真正的标题。 没有人会在开放图书馆中寻找它,因为那本书(具有该标题)不存在(还)。 我认为它不应该出现在任何图书目录中。 当具有该标题的版本发布时,是时候将其添加到目录(具有该标题)中,但不是之前。
只有真正的书籍和真正的标题。 我认为这是唯一正确的选择。
@jessamynwest这些将被手动更改。
开放图书馆没有人员配备。 这些不会被手动更改。
如果没有,你建议读者看看是否没有翻译成他们的语言的书?
这本书的出版语言。在我看来,您正在努力改善说英语的 OL 用户的 OL 用户体验。 我的建议仍然是:保持原样,添加一个不同的功能让用户指示他们的主要语言,并以此为基础构建功能。
只有真正的书籍和真正的标题。 我认为这是唯一正确的选择。
强烈赞同。
我认为我们正在陷入过早的讨论,这是在制定一个我们还没有准备好优先考虑的解决方案。 我认为所描述的解决方案还不够。 在利用我们必须为我们的顾客提供正确解决方案的基础设施方面,它需要更加细致入微。 我倾向于在我们做出正确决定以负责任地向前推进之前结束这个问题。 这个对话将留在这里供我们将来参考。
@mekarpeles听起来不错。 我只是想补充一点,我正在考虑音译以允许以每种语言进行搜索。 它只需要一个说明它是直接翻译而不是作品名称本身(所以人们知道,否则如果这本书根本不是他们的语言,就很难搜索)。 如果有针对实际书籍的翻译,则会手动添加 - 以一种可以看到两个差异的方式(例如突出显示实际书名)。 我想这还为时过早(抱歉我提得太早了),但我希望我能有所帮助。
@jessamynwest手动,他们这样做:OL 用户编辑,比如我和其他人。 剩下的,我不会阻止你发布新问题,但是这个问题已经关闭,所以如果它不再是一个好主意,那就别想了。
最有用的评论
作品标题的缺点是英文(而不是他们使用的任何语言)
工作标题的优点是英文
想为改变提出理由吗? 显示支持它的数据。 显示用户登陆非英语作品的跳出统计数据。 向我展示那些对不得不处理非英语书籍的非英语标题感到不安的用户的电子邮件。 这是一个数据驱动的网站,那么支持这一点的数据在哪里?