LICENSE 许可证 LICENCIA 許可證 CC BY-ND 4.0
始作俑者造谣,说汉语最高效,导致好多人跟风造谣。谁曾想,2011年有人推翻了这个结论,2018年有了声势浩大的抗议。2011年:越南语的信息密度最大,因此越南语最高效。2018年:没有更高效的语言。此话并非自恋:我尚未发现2018年的结论前,早已连续几次否定了“信息密度大等于高效”这个观点(不是自恋,而是事实)。语言没有 faster 也没有 fastest ,并且语言没有 slower 也没有 slowest 。那么问题来了,我未看2018年的文章前,我是如何判断的?此时您应该在浏览器中关闭那个2018年的网页。我是这么判断的:(建议将书面语和口语分离。量子力学:电或光通过双缝后碰到屏幕即有干涉条纹。)
★ 不可能有一门语言包含各种缺点:运动员怕缺氧是缺点(高原反应),在冬天抗寒是优点,以运动员的体魄不可能同时存在两个缺点。法语被公认为最严谨的语言,其实法语是避免了问题A但引发了问题B。英语“红茶”是 black tea ,叶子是黑的;汉语人士看水,英语人士看叶子。繁体中文“發”“髮”区分“发”,特殊语境下反而不如简体中文。
① 汉语“男孩”只有两个音节(省力), Rosetta Stone 越南语 một đứa con trai 要四个音节(费力)。
② 人们容易把“葛立恒数”读成“葛立,恒数”(错误),其实是“葛立恒,数”(正确);“中非”的歧义明显:中非共和国、中国与非洲。
③ 人们说的“Linux内核”容易被误解成内核的内核(错误),其实是说Linux本身是内核(正确)。因为“神经系统”是很多根神经相互关联,所以“Windows系统”是很多个Windows连起来。“自然语言”可代表地震、海啸、雷雨等等,其实是英语、汉语、冰岛语等等;写到这儿,不得不提:英语、汉语、冰岛语都是人类发明的,因此也能说它们是“人造语言”。
④ 还原佛教历史顿时产生歧义:记载「正法唯住五百年」的经律。(冷知识:按照2011年媒体的标准,梵语的信息密度大于越南语)
⑤ 自由软件的版权 copyleft 翻译有漏洞:一提到“谁能正确翻译,悬赏一亿欧元”,反而让人闻风丧胆、谈虎色变。 copyleft 本质上还是版权,所以“反版权”是错误的;“左版”“著佐权”“佐版”“版责”“版权属左”全是漏洞。西班牙语 sobremesa estrenar 用英语和汉语无法一一对应。
⑥ 量子计算机无法淘汰电脑。
⑦ en la caja 在盒子里、 en la mesa 在桌子上,介词都是 en ,可被误解为“在桌子里”。
⑧ 青蛙的叫声未必是“呱”,「英语人士」听着像 frog ;猫的叫声未必是“喵”,有些「汉语人士」认为猫叫就是“猫”。重要提示:别以为我用拼音输入法打错了,可能有的读者怀疑这里是「韩语人士」;我用五笔输入法也会打「汉语人士」。
⑨ quantum supremacy 被不恰当地翻译成“量子霸权”。有的语言有大舌音,大舌音更兼容某某领域。英语 Sunday Monday 暗示了基督教,我觉得白开水比汉语更香甜美味。→假如←语境合适, Monday 过了 24 小时是 Tuesday ; week one 过了 168 小时是 week two 。
⑩ 吃完巧克力自造语言、跳舞时自造语言、研究鱼肝油时自造语言,随时随地自造语言,结果发现任何语言都有漏洞。温馨提示:世界语、汎语也有漏洞。 Richard M. Stallman 对世人宣称 liberated freedom 这两个词有歧义。他搜索后发现 unfettered 恰到好处。“搜索”可在头脑中,也可在互联网,也可在别处;我猜他在头脑中搜索。
⑪ “今天骑车差点摔倒,还好我反应快,一把把把把住了;今天起床晚了差点没上上上上海的车”。照这样思考的话,汉语被英语打成渣,犹如葛立恒数被 TREE(3) 打成渣: Buffalo buffalo Buffalo buffalo buffalo buffalo Buffalo buffalo.
★ 有人说上下文和语境能避免“葛立,恒数”,大错特错!上下文可能只说了数学家怀疑的下限已从 11 上升至 13 。语境也可能有歧义,因此语境只是心理安慰。
★ 那么问题来了,怎么定义“高效”?一些定义和另一些定义打架了,如果高效是容易讲笑话,就和“严谨”打架。据「不完全」统计,语言都能描述的笑话:小明吃汤圆时,馅喷出来了。有的笑话需要特定语言来描述, God, it’s too hard. 是语言本身的笑话。温馨提示: hard 有歧义。如果高效是容易考古,就和别的定义打架:甲骨文“鼎”很像一只猫;现代语言包含之前所有变化,点餐时一言难尽。用葛立恒数个字词去定义“高效”,也没有更高效的语言。有人骂韩语难听,反例多到数不清,只是他们不知道有反例。
对于葛立恒数那个,汉语有歧义,英语 Graham’s number 能清晰表达,但可能被误解为 Graham is number ,建议用西班牙语 número de Graham ;对于“Linux内核”和“Windows系统”,汉语和英语都有歧义,用西班牙语 el núcleo Linux 和 el sistema Windows 能清晰表达;越南语问题,反驳了2011年的媒体;关于 ④ 提到的问题,我不知道哪门语言没有歧义,假如您发现哪门语言没有歧义,请您迅速回复;写到这儿,不得不提《杂阿含经》,释迦牟尼明令禁止梵语,释迦牟尼可能发现梵语的某些漏洞能被别的语言弥补。不知道哪门语言能解释清楚 ② 的“自然语言”和“人造语言”,也请您帮忙寻找。大力鸣谢 Richard M. Stallman ,他提倡人们用 GNU/Linux ,开源软件不等于自由软件。 Richard M. Stallman 已抛弃了龙芯。龙芯本出厂预装的操作系统是错误的,好像 iPad 出厂预装 iOS 。
⑥ 的解释:新鲜葡萄脱水了是葡萄干,电子在某些环境下呈量子态,氢也有量子态;氢气易燃易爆,防火请用氦气。薛定谔的猫概括了量子处于叠加态,冷知识:升级版是把薛定谔放入箱子。若要破解 AES RSA ,叠加态让人类猜不中密钥,优势变劣势,必须连根拔除劣势。 RSA-2048 用量子破解,要准备 4099 个量子位,少一位则无法破解; RSA-4096 用量子破解,要准备 8195 个量子位,少一位则无法破解。 ECC 还要难,量子位要大约六倍: ECC-256 用量子破解,要准备大约 1536 个量子位。两台电脑(陌生)能直接通信,除非对方有防火墙。即使彻底删除了防火墙,两台量子计算机(朋友)也无法直接通信,需要先用电脑确定协议。距离太远了,两个量子无法纠缠;距离越远,夸克禁闭反而越强。
⑧ 的解释: Edward Joseph Snowden 俗称“斯诺登”,他在俄罗斯避难。假设俄罗斯吞并了美国,斯诺登随时被捕。很多人发帖称“出现新事物,汉语只要把字组合起来,保持中国大陆统一”(这个“很多人”并不包括我),“拿”是手合起来,英语 take 看不出 hand 。那些人还发帖“欧洲分裂是因为表音文字”。万一您像斯诺登一样,您或许很庆幸这些小国无法统一。那么问题来了,“表音文字百亿个单词”以及“汉语把字组合起来”一定造成如今的场面吗?有几率失败;量子力学的话说,叠加态。西班牙语名词的 el 和 la 是阴阳性(或者说男女性),必定更兼容某领域,大舌音更兼容某领域。 🎉 西班牙语 en la mesa 无法篡改效率, 🎉 汉语“葛立,恒数”无法篡改效率, 🎉 越南语 một đứa con trai 无法篡改效率。
❌ 有人说:无歧义且简洁,无损压缩;有歧义但简洁,有损压缩;无歧义但冗长,低效。大错特错!
✅ 此人忽视了两点:其一,电脑和人脑的算法不同;其二,局部和整体的区别。虽然 TREE(3) 大于葛立恒数,但是 TREE(2) 等于三, TREE(1) 等于一。因为 TREE(2) 只有树根和树枝,所以只有三。俗话说“三生万物”, TREE() 代入二的运算结果只是小不点。电脑资源何其有限,因此不能这么比喻;电脑和人脑的算法不同,还是不能这么比喻。
三角形面积公式是底乘高除以二。底下放两个角,顶上剩一个角;过顶上的点画一条和底平行的虚线,把顶上的角按着虚线移动四万米,三角形面积不变。量子叠加了葛立恒数门语言,也找不到哪门更高效;所以法语避免了问题A但引发问题B。貌似西班牙语 la señal de derecho de autor 很怪异。
¿? 那么问题来了,所有语言相加能否描述全宇宙?根据量子力学,我认为不能;两个语言相加出现某歧义,两个语言分离删除该歧义。汉语“窗户”翻译成日本語 窓 ;猫咪谈恋爱可能汪汪叫,汉语“老公”翻译成日本語 主人 。频率篡改能量(不是经典力学 E=mc² ,而是量子力学 E=hv ),汉语“窓”频率低;上古汉语、中古汉语、现代汉语分成三门语言,但因为“自然语言”可代表地震、海啸、雷雨,所以这三门语言属于另一门语言。根据某々力学,您的大脑(或观测者)认为这是几门语言,即使会影响未来,也无法篡改效率。 copyleft 汉语无法翻译,用另一门语言也许能翻译,假设翻译成 ♨︎ ;用汉语传授这门语言, ♨︎ 指代 copyleft ,也可用 Rosetta Stone 传授这门语言。混合多门语言,甚至不知道对方用的什么语言,更不可能描述全宇宙。温馨提示:现实宇宙中存在类似事件, ampersand 词根是 & per se and 。
后记
外国人发贴 I was talking with some of my native Spanish-speaking in-laws, complaining (in a good-natured way) about how illogical their language is. I asked, “¿Porqué es EL agua en vez de LA agua?” The answer, after some discussion and thought: “Porque el agua está en EL lago, EL mar, EL oceano, o EL río.” Needless to say, this answer was not founded in serious formal study of Spanish grammar. 未查这个答案之前、未接触母语者、未请导师,我早已猜到相似的答案。本文一开始就写我尚未看2018年的文章之前就认为没有更慢或更快的语言。 ★ 我感觉:量子计算机辅佑经典计算机的效率依旧不变,一年算出一加一等于二,效率等于一分钟算出 TREE(4) 。
始作俑者造谣,说汉语最高效,导致好多人跟风造谣。谁曾想,2011年有人推翻了这个结论,2018年有了声势浩大的抗议。2011年:越南语的信息密度最大,因此越南语最高效。2018年:没有更高效的语言。此话并非自恋:我尚未发现2018年的结论前,早已连续几次否定了“信息密度大等于高效”这个观点(不是自恋,而是事实)。语言没有 faster 也没有 fastest ,并且语言没有 slower 也没有 slowest 。那么问题来了,我未看2018年的文章前,我是如何判断的?此时您应该在浏览器中关闭那个2018年的网页。我是这么判断的:(建议将书面语和口语分离。量子力学:电或光通过双缝后碰到屏幕即有干涉条纹。)
★ 不可能有一门语言包含各种缺点:运动员怕缺氧是缺点(高原反应),在冬天抗寒是优点,以运动员的体魄不可能同时存在两个缺点。法语被公认为最严谨的语言,其实法语是避免了问题A但引发了问题B。英语“红茶”是 black tea ,叶子是黑的;汉语人士看水,英语人士看叶子。繁体中文“發”“髮”区分“发”,特殊语境下反而不如简体中文。
① 汉语“男孩”只有两个音节(省力), Rosetta Stone 越南语 một đứa con trai 要四个音节(费力)。
② 人们容易把“葛立恒数”读成“葛立,恒数”(错误),其实是“葛立恒,数”(正确);“中非”的歧义明显:中非共和国、中国与非洲。
③ 人们说的“Linux内核”容易被误解成内核的内核(错误),其实是说Linux本身是内核(正确)。因为“神经系统”是很多根神经相互关联,所以“Windows系统”是很多个Windows连起来。“自然语言”可代表地震、海啸、雷雨等等,其实是英语、汉语、冰岛语等等;写到这儿,不得不提:英语、汉语、冰岛语都是人类发明的,因此也能说它们是“人造语言”。
④ 还原佛教历史顿时产生歧义:记载「正法唯住五百年」的经律。(冷知识:按照2011年媒体的标准,梵语的信息密度大于越南语)
⑤ 自由软件的版权 copyleft 翻译有漏洞:一提到“谁能正确翻译,悬赏一亿欧元”,反而让人闻风丧胆、谈虎色变。 copyleft 本质上还是版权,所以“反版权”是错误的;“左版”“著佐权”“佐版”“版责”“版权属左”全是漏洞。西班牙语 sobremesa estrenar 用英语和汉语无法一一对应。
⑥ 量子计算机无法淘汰电脑。
⑦ en la caja 在盒子里、 en la mesa 在桌子上,介词都是 en ,可被误解为“在桌子里”。
⑧ 青蛙的叫声未必是“呱”,「英语人士」听着像 frog ;猫的叫声未必是“喵”,有些「汉语人士」认为猫叫就是“猫”。重要提示:别以为我用拼音输入法打错了,可能有的读者怀疑这里是「韩语人士」;我用五笔输入法也会打「汉语人士」。
⑨ quantum supremacy 被不恰当地翻译成“量子霸权”。有的语言有大舌音,大舌音更兼容某某领域。英语 Sunday Monday 暗示了基督教,我觉得白开水比汉语更香甜美味。→假如←语境合适, Monday 过了 24 小时是 Tuesday ; week one 过了 168 小时是 week two 。
⑩ 吃完巧克力自造语言、跳舞时自造语言、研究鱼肝油时自造语言,随时随地自造语言,结果发现任何语言都有漏洞。温馨提示:世界语、汎语也有漏洞。 Richard M. Stallman 对世人宣称 liberated freedom 这两个词有歧义。他搜索后发现 unfettered 恰到好处。“搜索”可在头脑中,也可在互联网,也可在别处;我猜他在头脑中搜索。
⑪ “今天骑车差点摔倒,还好我反应快,一把把把把住了;今天起床晚了差点没上上上上海的车”。照这样思考的话,汉语被英语打成渣,犹如葛立恒数被 TREE(3) 打成渣: Buffalo buffalo Buffalo buffalo buffalo buffalo Buffalo buffalo.
★ 有人说上下文和语境能避免“葛立,恒数”,大错特错!上下文可能只说了数学家怀疑的下限已从 11 上升至 13 。语境也可能有歧义,因此语境只是心理安慰。
★ 那么问题来了,怎么定义“高效”?一些定义和另一些定义打架了,如果高效是容易讲笑话,就和“严谨”打架。据「不完全」统计,语言都能描述的笑话:小明吃汤圆时,馅喷出来了。有的笑话需要特定语言来描述, God, it’s too hard. 是语言本身的笑话。温馨提示: hard 有歧义。如果高效是容易考古,就和别的定义打架:甲骨文“鼎”很像一只猫;现代语言包含之前所有变化,点餐时一言难尽。用葛立恒数个字词去定义“高效”,也没有更高效的语言。有人骂韩语难听,反例多到数不清,只是他们不知道有反例。
对于葛立恒数那个,汉语有歧义,英语 Graham’s number 能清晰表达,但可能被误解为 Graham is number ,建议用西班牙语 número de Graham ;对于“Linux内核”和“Windows系统”,汉语和英语都有歧义,用西班牙语 el núcleo Linux 和 el sistema Windows 能清晰表达;越南语问题,反驳了2011年的媒体;关于 ④ 提到的问题,我不知道哪门语言没有歧义,假如您发现哪门语言没有歧义,请您迅速回复;写到这儿,不得不提《杂阿含经》,释迦牟尼明令禁止梵语,释迦牟尼可能发现梵语的某些漏洞能被别的语言弥补。不知道哪门语言能解释清楚 ② 的“自然语言”和“人造语言”,也请您帮忙寻找。大力鸣谢 Richard M. Stallman ,他提倡人们用 GNU/Linux ,开源软件不等于自由软件。 Richard M. Stallman 已抛弃了龙芯。龙芯本出厂预装的操作系统是错误的,好像 iPad 出厂预装 iOS 。
⑥ 的解释:新鲜葡萄脱水了是葡萄干,电子在某些环境下呈量子态,氢也有量子态;氢气易燃易爆,防火请用氦气。薛定谔的猫概括了量子处于叠加态,冷知识:升级版是把薛定谔放入箱子。若要破解 AES RSA ,叠加态让人类猜不中密钥,优势变劣势,必须连根拔除劣势。 RSA-2048 用量子破解,要准备 4099 个量子位,少一位则无法破解; RSA-4096 用量子破解,要准备 8195 个量子位,少一位则无法破解。 ECC 还要难,量子位要大约六倍: ECC-256 用量子破解,要准备大约 1536 个量子位。两台电脑(陌生)能直接通信,除非对方有防火墙。即使彻底删除了防火墙,两台量子计算机(朋友)也无法直接通信,需要先用电脑确定协议。距离太远了,两个量子无法纠缠;距离越远,夸克禁闭反而越强。
⑧ 的解释: Edward Joseph Snowden 俗称“斯诺登”,他在俄罗斯避难。假设俄罗斯吞并了美国,斯诺登随时被捕。很多人发帖称“出现新事物,汉语只要把字组合起来,保持中国大陆统一”(这个“很多人”并不包括我),“拿”是手合起来,英语 take 看不出 hand 。那些人还发帖“欧洲分裂是因为表音文字”。万一您像斯诺登一样,您或许很庆幸这些小国无法统一。那么问题来了,“表音文字百亿个单词”以及“汉语把字组合起来”一定造成如今的场面吗?有几率失败;量子力学的话说,叠加态。西班牙语名词的 el 和 la 是阴阳性(或者说男女性),必定更兼容某领域,大舌音更兼容某领域。 🎉 西班牙语 en la mesa 无法篡改效率, 🎉 汉语“葛立,恒数”无法篡改效率, 🎉 越南语 một đứa con trai 无法篡改效率。
❌ 有人说:无歧义且简洁,无损压缩;有歧义但简洁,有损压缩;无歧义但冗长,低效。大错特错!
✅ 此人忽视了两点:其一,电脑和人脑的算法不同;其二,局部和整体的区别。虽然 TREE(3) 大于葛立恒数,但是 TREE(2) 等于三, TREE(1) 等于一。因为 TREE(2) 只有树根和树枝,所以只有三。俗话说“三生万物”, TREE() 代入二的运算结果只是小不点。电脑资源何其有限,因此不能这么比喻;电脑和人脑的算法不同,还是不能这么比喻。
三角形面积公式是底乘高除以二。底下放两个角,顶上剩一个角;过顶上的点画一条和底平行的虚线,把顶上的角按着虚线移动四万米,三角形面积不变。量子叠加了葛立恒数门语言,也找不到哪门更高效;所以法语避免了问题A但引发问题B。貌似西班牙语 la señal de derecho de autor 很怪异。
¿? 那么问题来了,所有语言相加能否描述全宇宙?根据量子力学,我认为不能;两个语言相加出现某歧义,两个语言分离删除该歧义。汉语“窗户”翻译成日本語 窓 ;猫咪谈恋爱可能汪汪叫,汉语“老公”翻译成日本語 主人 。频率篡改能量(不是经典力学 E=mc² ,而是量子力学 E=hv ),汉语“窓”频率低;上古汉语、中古汉语、现代汉语分成三门语言,但因为“自然语言”可代表地震、海啸、雷雨,所以这三门语言属于另一门语言。根据某々力学,您的大脑(或观测者)认为这是几门语言,即使会影响未来,也无法篡改效率。 copyleft 汉语无法翻译,用另一门语言也许能翻译,假设翻译成 ♨︎ ;用汉语传授这门语言, ♨︎ 指代 copyleft ,也可用 Rosetta Stone 传授这门语言。混合多门语言,甚至不知道对方用的什么语言,更不可能描述全宇宙。温馨提示:现实宇宙中存在类似事件, ampersand 词根是 & per se and 。
后记
外国人发贴 I was talking with some of my native Spanish-speaking in-laws, complaining (in a good-natured way) about how illogical their language is. I asked, “¿Porqué es EL agua en vez de LA agua?” The answer, after some discussion and thought: “Porque el agua está en EL lago, EL mar, EL oceano, o EL río.” Needless to say, this answer was not founded in serious formal study of Spanish grammar. 未查这个答案之前、未接触母语者、未请导师,我早已猜到相似的答案。本文一开始就写我尚未看2018年的文章之前就认为没有更慢或更快的语言。 ★ 我感觉:量子计算机辅佑经典计算机的效率依旧不变,一年算出一加一等于二,效率等于一分钟算出 TREE(4) 。