一位美国人撰写了大部分苏格兰语维基百科。他们全都错了。

梅里达公主拥有它

语言是一个复杂的东西。人们在整个职业生涯中都在学习其他语言并从一种语言翻译成另一种语言,因为翻译从来都不是将单词插入搜索引擎或字典并查看结果那么简单。这适用于广泛使用的语言,对于较少使用和理解的语言更是如此,比如说……苏格兰语。但这并没有阻止一位勇敢的美国互联网用户为整个互联网定义苏格兰人。

哦,确实如此。系好安全带。

首先,让我们了解一下我们的方位。对于那些可能不知道的人, 苏格兰人是 今天在苏格兰使用的三种母语之一,另外两种是英语和苏格兰盖尔语。苏格兰语是苏格兰方言的统称,也被称为“Doric”、“Lallans”和“Scotch”或更多的本地名称,如“Buchan”、“Dundonian”、“Glesca”或“Shetland”。这是根据苏格兰语言中心的说法,我认为这是一个可靠的来源。我们马上就会明白为什么我很谨慎。

正如您所看到的,苏格兰语是一种非常复杂的语言,有很多方言和变体,而且它不像其他语言(例如西班牙语)那样广为人知、被广泛研究或教授。但是,互联网就是这样,有一些工具和参考资料可供对苏格兰人感兴趣的人使用。应该有这种语言的网站……像维基百科这样的网站,内容和翻译是由人们用某种语言制作的。

这让我们想到了一个非常奇怪的案例 苏格兰语维基百科 .一个 wiki,里面有数以万计的条目,内容应该是苏格兰语……它们几乎都是由一个非常多产且非常美国的人编写的。一个……不会说苏格兰语的人。 本周早些时候,Reddit 上的一位用户首次发现了这种奇怪现象,他在一篇现已疯传的帖子中解释了他们的怀疑和发现。 r/Scotland 上的用户 Ultach 写道:

维基百科的苏格兰语版本非常糟糕。卷入关于苏格兰语的语言辩论的人们经常用它来证明苏格兰语不是一种语言,如果它是一种准确的表示,他们可能是对的。它几乎没有使用苏格兰语词汇,它使用的很少通常是不正确的,并且语法总是符合标准英语,而不是苏格兰语。

Ultach 想看看是谁在 Scots Wiki 上制作了这些糟糕的条目,并发现了一些非常惊人的东西。

我检查了编辑历史,看看是否有人尝试过更正它,但它只被一个人编辑过。出于好奇,我点击了他们的用户页面,发现他们已经创建和编辑了数以万计的其他文章,而这在一个 Wiki 上总共只有 60,000 篇左右的文章!他们创建的每个页面都是一样的。与文章的英文版相同,但在这里和那里有一些修改的拼写,如果你真的很幸运,也许会在其中加入一个苏格兰词。

现在,像 Ultach 一样,我们不会暴露这个 Wiki 编辑器,也不会羞辱他们。他们似乎是真心实意地想做点什么,但他们做事的方式并不正确。那是因为语言比一对一翻译复杂得多。这位用户不明白苏格兰语有自己的语法,他们不明白某些单词是如何翻译的,仅仅通过糟糕的在线苏格兰语词典运行英语并不能削减它。

正如互联网语言学家 Gretchen McCulloch 在一篇精彩的帖子中所解释的那样,这不是它的工作方式。

所以这有点疯狂和奇怪,但它不会伤害任何人,对吧?嗯,事实上,确实如此。

因为我们生活在一个互联网和人工智能时代,所以有各种各样的算法、程序、机器人和不同的技术,它们使用诸如维基百科条目之类的东西来学习这种语言。在软件意义上,这是病毒式传播的定义,当糟糕的语言示例被集成到这些系统中时,因为当程序学习错误时,很难将其删除。

尤其是在这里,苏格兰语是一种较少使用的语言,我们可以从整个崩溃中看到,苏格兰以外的人知之甚少,这种事情真的很有害。不仅仅是在编程或 AI 意义上,而且对于那些努力让这种语言得到更广泛认可和值得研究和尊重的真正的人来说。对他们来说,这是他们文化和遗产的一部分的人。

我会让 Redditor Ultach 解释一下:

这听起来令人难以置信的夸张和歇斯底里,但我认为这个人对苏格兰语的破坏可能比历史上任何人都多。他们以前所未有的规模从事文化破坏活动。维基百科是世界上访问量最大的网站之一。现在可能有数以千万计的人认为苏格兰语是对英语的严重破坏,而不是它自己的语言或方言,这一切都是因为他们接触到了被这个人和这个人单独称为苏格兰人的英语被破坏的翻译.他们写了大量这种假冒的苏格兰语,以至于任何用真正的苏格兰语写作的人都会让他们的作品被垃圾淹没。或者,更糟糕的是,编辑更符合所说的垃圾。

如果确实发生这种情况,很可能需要很长时间才能修复苏格兰语维基百科。只需要一个非常敬业的人来打破它,但要撤销它并正确翻译它可能需要更多的时间。我希望它会。但在这种情况下,如果我们走高路而该用户走低路,他肯定比我们先到了苏格兰语维基百科。

(通过: 格雷琴·麦卡洛克/推特 ,图片:皮克斯)

想要更多这样的故事吗?成为订阅者并支持该网站!

— 玛丽苏有严格的评论政策,禁止但不限于个人侮辱 任何人 、仇恨言论和拖钓。—