全部回帖
熵高=混乱度高=歧义多=无序,三体里,把生命称为“低熵体”;
事实上,因为中文无法通过词面来判断“词性”,需要通过词语在句子中不同的位置来判断“主谓宾语”,
而且口语和书面语中大量的“动词使动被动用法”“名词直接做主语”“倒装句”等特殊用法,
这种特殊性,结合中文的单音节字,让中文在音律和对仗公正方面领先于字面语言,也导致中文在严谨性方面存在先天劣势。
到你这,信息熵高=更先进,这特喵也能遥遥领先?
熵高=混乱度高=歧义多=无序,三体里,把生命称为“低熵体”;
事实上,因为中文无法通过词面来判断“词性”,需要通过词语在句子中不同的位置来判断“主谓宾语”,
而且口语和书面语中大量的“动词使动被动用法”“名词直接做主语”“倒装句”等特殊用法,
这种特殊性,结合中文的单音节字,让中文在音律和对仗公正方面领先于字面语言,也导致中文在严谨性方面存在先天劣势。
到你这,信息熵高=更先进,这特喵也能遥遥领先?
我不想去争谁更先进,但是信息熵这个话题可以说道说道。我懒得去翻论文了,大家都来看点二手知识。熵越高确实代表系统越混乱,但是在语言中,信息熵越高意味着符号相关度低,单个符号携带的信息量更大,所以汉字天然就比拼音文字信息量大,在文字效率上具有天然的优势。中文的歧义劣势并不是来自于你说的什么什么主谓宾语法之类的东西,而是因为发音组合太少,汉字有5000多个,但是发音组合在考虑声调的时候只有1200多种,不考虑声调才300多种,这意味着在语音上中文具有丢失信息的劣势。
所以总结一下也很简单,中文在文字上具有更高的效率,但是在语音上容易丢失信息,所以大家看视频都爱看字幕,因为文字更为准确高效,而这种文字层面的高效使得中国人天然阅读母语的速度更快,在看字幕的时候也不会影响观看视频画面。
我觉得很多时候虎扑上这种小孩式的争吵就很没意思,大家其实都是拿着现有的知识拍脑门讨论,到最后就开始互相扣帽子人身攻击,愿意花精力骂架都不愿意动动手去查一查,其实有时候结论人家早就得出来了。我也不懂语言学,也不懂信息论,但是我读过基本的书,看得懂论文看得懂知乎b站科普,所以我会去查,哪怕看别人总结出来的二手知识也好过虚空讨论。所以就这点而言,我不理解为什么虎扑还有那么多人真看不起知乎
https://zhuanlan.zhihu.com/p/89958871?utm_psn=1744428887969558529
我不想去争谁更先进,但是信息熵这个话题可以说道说道。我懒得去翻论文了,大家都来看点二手知识。熵越高确实代表系统越混乱,但是在语言中,信息熵越高意味着符号相关度低,单个符号携带的信息量更大,所以汉字天然就比拼音文字信息量大,在文字效率上具有天然的优势。中文的歧义劣势并不是来自于你说的什么什么主谓宾语法之类的东西,而是因为发音组合太少,汉字有5000多个,但是发音组合在考虑声调的时候只有1200多种,不考虑声调才300多种,这意味着在语音上中文具有丢失信息的劣势。
所以总结一下也很简单,中文在文字上具有更高的效率,但是在语音上容易丢失信息,所以大家看视频都爱看字幕,因为文字更为准确高效,而这种文字层面的高效使得中国人天然阅读母语的速度更快,在看字幕的时候也不会影响观看视频画面。
我觉得很多时候虎扑上这种小孩式的争吵就很没意思,大家其实都是拿着现有的知识拍脑门讨论,到最后就开始互相扣帽子人身攻击,愿意花精力骂架都不愿意动动手去查一查,其实有时候结论人家早就得出来了。我也不懂语言学,也不懂信息论,但是我读过基本的书,看得懂论文看得懂知乎b站科普,所以我会去查,哪怕看别人总结出来的二手知识也好过虚空讨论。所以就这点而言,我不理解为什么虎扑还有那么多人真看不起知乎
https://zhuanlan.zhihu.com/p/89958871?utm_psn=1744428887969558529
还有一点是中国文盲率低
哈哈哈哈,你这是一招窝心脚
哈哈哈哈,你这是一招窝心脚
而且中国电视剧包含着来自不同地方文化的剧情,面向的也是不同地方文化的观众,我的奶奶普通话说不好,听普通话能力也一般,但是不妨碍她看电视看的津津有味,因为她能读懂字幕,这就是字幕对中国人重要的一个原因
而且中国电视剧包含着来自不同地方文化的剧情,面向的也是不同地方文化的观众,我的奶奶普通话说不好,听普通话能力也一般,但是不妨碍她看电视看的津津有味,因为她能读懂字幕,这就是字幕对中国人重要的一个原因
相声小品这些我妈很多听不太懂,但一样看得津津有味,就是能读懂字幕
相声小品这些我妈很多听不太懂,但一样看得津津有味,就是能读懂字幕
因为现在计算机的运算能力和字库更新能力已经能结合上下文和输入习惯帮你从众多同音字/词里自动选择最合语境和符合你语言习惯的常用字了,极大的抹平了拼音输入和五笔输入在“选词”过程中的速度和正确率的差距(五笔输入只要字根输入对了,几乎不需要选字)。
而拼音输入只需要记26个字母,五笔得记26个字母每个字母对应的好几个字根,门槛太高。
如果说当年的智能拼音ABC输入法是自行车,那现在以sogou为代表的智能拼音输入法就是上了高速的私家车;
但五笔的进化速度,仅仅是把当年300的高铁,提升到320而已。
(我也知道高铁快,还不是因为复兴号太贵买不起么?)
因为现在计算机的运算能力和字库更新能力已经能结合上下文和输入习惯帮你从众多同音字/词里自动选择最合语境和符合你语言习惯的常用字了,极大的抹平了拼音输入和五笔输入在“选词”过程中的速度和正确率的差距(五笔输入只要字根输入对了,几乎不需要选字)。
而拼音输入只需要记26个字母,五笔得记26个字母每个字母对应的好几个字根,门槛太高。
如果说当年的智能拼音ABC输入法是自行车,那现在以sogou为代表的智能拼音输入法就是上了高速的私家车;
但五笔的进化速度,仅仅是把当年300的高铁,提升到320而已。
(我也知道高铁快,还不是因为复兴号太贵买不起么?)
所以不还是拼音效率高吗?学习成本不算效率?
所以不还是拼音效率高吗?学习成本不算效率?
我有个疑问,中文这么难,为什么小孩子两三岁都会说话?小学文凭基本常用汉字都能认识?
我有个疑问,中文这么难,为什么小孩子两三岁都会说话?小学文凭基本常用汉字都能认识?
你说的是“日常”这个层级,还有更高层级:细分的专业领域。比如说阿拉伯数字等符号在数学领域的优势。像很多专业用英语,就是先发者优势。
像隔壁的韩国拼音文字,据说在一些领域就非常糟糕。
你说的是“日常”这个层级,还有更高层级:细分的专业领域。比如说阿拉伯数字等符号在数学领域的优势。像很多专业用英语,就是先发者优势。
像隔壁的韩国拼音文字,据说在一些领域就非常糟糕。
我不想去争谁更先进,但是信息熵这个话题可以说道说道。我懒得去翻论文了,大家都来看点二手知识。熵越高确实代表系统越混乱,但是在语言中,信息熵越高意味着符号相关度低,单个符号携带的信息量更大,所以汉字天然就比拼音文字信息量大,在文字效率上具有天然的优势。中文的歧义劣势并不是来自于你说的什么什么主谓宾语法之类的东西,而是因为发音组合太少,汉字有5000多个,但是发音组合在考虑声调的时候只有1200多种,不考虑声调才300多种,这意味着在语音上中文具有丢失信息的劣势。所以总结一下也很简单,中文在文字上具有更高的效率,但是在语音上容易丢失信息,所以大家看视频都爱看字幕,因为文字更为准确高效,而这种文字层面的高效使得中国人天然阅读母语的速度更快,在看字幕的时候也不会影响观看视频画面。我觉得很多时候虎扑上这种小孩式的争吵就很没意思,大家其实都是拿着现有的知识拍脑门讨论,到最后就开始互相扣帽子人身攻击,愿意花精力骂架都不愿意动动手去查一查,其实有时候结论人家早就得出来了。我也不懂语言学,也不懂信息论,但是我读过基本的书,看得懂论文看得懂知乎b站科普,所以我会去查,哪怕看别人总结出来的二手知识也好过虚空讨论。所以就这点而言,我不理解为什么虎扑还有那么多人真看不起知乎https://zhuanlan.zhihu.com/p/89958871?utm_psn=1744428887969558529
我不想去争谁更先进,但是信息熵这个话题可以说道说道。我懒得去翻论文了,大家都来看点二手知识。熵越高确实代表系统越混乱,但是在语言中,信息熵越高意味着符号相关度低,单个符号携带的信息量更大,所以汉字天然就比拼音文字信息量大,在文字效率上具有天然的优势。中文的歧义劣势并不是来自于你说的什么什么主谓宾语法之类的东西,而是因为发音组合太少,汉字有5000多个,但是发音组合在考虑声调的时候只有1200多种,不考虑声调才300多种,这意味着在语音上中文具有丢失信息的劣势。
所以总结一下也很简单,中文在文字上具有更高的效率,但是在语音上容易丢失信息,所以大家看视频都爱看字幕,因为文字更为准确高效,而这种文字层面的高效使得中国人天然阅读母语的速度更快,在看字幕的时候也不会影响观看视频画面。
我觉得很多时候虎扑上这种小孩式的争吵就很没意思,大家其实都是拿着现有的知识拍脑门讨论,到最后就开始互相扣帽子人身攻击,愿意花精力骂架都不愿意动动手去查一查,其实有时候结论人家早就得出来了。我也不懂语言学,也不懂信息论,但是我读过基本的书,看得懂论文看得懂知乎b站科普,所以我会去查,哪怕看别人总结出来的二手知识也好过虚空讨论。所以就这点而言,我不理解为什么虎扑还有那么多人真看不起知乎
https://zhuanlan.zhihu.com/p/89958871?utm_psn=1744428887969558529
我从来也没否认过单个汉字携带的信息量更大啊——这点体会最深的应该是那些学化学的人(我觉得不用加“之一”)。
真正的问题在于,“字”作为语言里最基本的单元,离形成能表达完整意思的句子,还有经过“词”、“短语”两级,离形成传递思想的文章则更远。一个“字”能携带的信息量上限就只有那么点,无法达到传达完整信息目的。
所以,词语,短语终究是绕不过的。最终还是要回到那两个天然缺陷里。
这两个天然缺陷比较直观的影响——在对一个新概念赋意,需要用到长定语时,大量的名词做定语指代关系不清楚造成歧义,导致知识传输效率降低。这个影响几乎是完全负面的。
而比较隐蔽的影响……解读歧义的过程,更有利于既得利益者和权力上位者贯彻实施自己的意图——就拿我前面提到的“可爱的小女孩的小狗”来说,可爱到底是形容小女孩,还是形容小狗,恐怕就只有我自己知道了。当然,因为这对社会稳定是有积极意义的,所以不能说是一个纯粹的负面影响。
以上,我甚至都没提到你说的那个“汉语发音音节有限”的劣势——其实我觉得这方面的劣势没那么大,因为面对面的交流是可以通过肢体语言,表情变化来辅助传递信息的;哪怕是只听声音不见面,也都有音调和语速的变化可以帮助理解。而且就“口口相传”的信息丢包率来说(这方面各种语言大家谁都别笑话谁……),这特喵的也算事儿?
我从来也没否认过单个汉字携带的信息量更大啊——这点体会最深的应该是那些学化学的人(我觉得不用加“之一”)。
真正的问题在于,“字”作为语言里最基本的单元,离形成能表达完整意思的句子,还有经过“词”、“短语”两级,离形成传递思想的文章则更远。一个“字”能携带的信息量上限就只有那么点,无法达到传达完整信息目的。
所以,词语,短语终究是绕不过的。最终还是要回到那两个天然缺陷里。
这两个天然缺陷比较直观的影响——在对一个新概念赋意,需要用到长定语时,大量的名词做定语指代关系不清楚造成歧义,导致知识传输效率降低。这个影响几乎是完全负面的。
而比较隐蔽的影响……解读歧义的过程,更有利于既得利益者和权力上位者贯彻实施自己的意图——就拿我前面提到的“可爱的小女孩的小狗”来说,可爱到底是形容小女孩,还是形容小狗,恐怕就只有我自己知道了。当然,因为这对社会稳定是有积极意义的,所以不能说是一个纯粹的负面影响。
以上,我甚至都没提到你说的那个“汉语发音音节有限”的劣势——其实我觉得这方面的劣势没那么大,因为面对面的交流是可以通过肢体语言,表情变化来辅助传递信息的;哪怕是只听声音不见面,也都有音调和语速的变化可以帮助理解。而且就“口口相传”的信息丢包率来说(这方面各种语言大家谁都别笑话谁……),这特喵的也算事儿?
不是。。。这跟历史无关啊,dna(脱氧核糖核酸)这东西就算是中国人先发现,也没法简单一两个字表达出来,因为这东西本身很复杂,除非你新造一个字,但你又说了不靠新造字,那么哪怕不叫跟随西方人叫”脱氧核糖核酸“,也无非是另一串汉字来命名,还是依然无法缩写。
贸易术语都是这种,
不是。。。这跟历史无关啊,dna(脱氧核糖核酸)这东西就算是中国人先发现,也没法简单一两个字表达出来,因为这东西本身很复杂,除非你新造一个字,但你又说了不靠新造字,那么哪怕不叫跟随西方人叫”脱氧核糖核酸“,也无非是另一串汉字来命名,还是依然无法缩写。
贸易术语都是这种,
你举了个很差的例子,因为脱氧核糖核酸也可以叫脱氧核酸,压根不需要缩写。
中国人学生物化学最大的优势就是,名字简单且最大限度保留了信息量,压根就不用缩写。
我再给你举个例子 Washington D.C, 我们就不需要缩写 华盛顿特区
你要知道,英文中缩写多并不是英文的优势,而是因为原词太长半天说不完,不得不用缩写这种几乎丢失原词全部信息的权宜之计。
中文也能缩写,什么词都能缩,最有价值球员是吧,嫌长我给你缩成 最值员 不就行了,只是MVP这个词太出名了我们沿用了而已。篮球当中没沿用英文,用自己的词也有很多 P&R 我们说挡拆 CS 我们说接球投 ,根本没难度。
你第一次听说 北上广,结合一下上下文马上能猜出是北京上海广州 但我现场编一个BNL,你能猜出我在说什么嘛?
你举了个很差的例子,因为脱氧核糖核酸也可以叫脱氧核酸,压根不需要缩写。
中国人学生物化学最大的优势就是,名字简单且最大限度保留了信息量,压根就不用缩写。
我再给你举个例子 Washington D.C, 我们就不需要缩写 华盛顿特区
你要知道,英文中缩写多并不是英文的优势,而是因为原词太长半天说不完,不得不用缩写这种几乎丢失原词全部信息的权宜之计。
中文也能缩写,什么词都能缩,最有价值球员是吧,嫌长我给你缩成 最值员 不就行了,只是MVP这个词太出名了我们沿用了而已。篮球当中没沿用英文,用自己的词也有很多 P&R 我们说挡拆 CS 我们说接球投 ,根本没难度。
你第一次听说 北上广,结合一下上下文马上能猜出是北京上海广州 但我现场编一个BNL,你能猜出我在说什么嘛?
不是。。。这跟历史无关啊,dna(脱氧核糖核酸)这东西就算是中国人先发现,也没法简单一两个字表达出来,因为这东西本身很复杂,除非你新造一个字,但你又说了不靠新造字,那么哪怕不叫跟随西方人叫”脱氧核糖核酸“,也无非是另一串汉字来命名,还是依然无法缩写。
贸易术语都是这种,
不是。。。这跟历史无关啊,dna(脱氧核糖核酸)这东西就算是中国人先发现,也没法简单一两个字表达出来,因为这东西本身很复杂,除非你新造一个字,但你又说了不靠新造字,那么哪怕不叫跟随西方人叫”脱氧核糖核酸“,也无非是另一串汉字来命名,还是依然无法缩写。
贸易术语都是这种,
刚开始玩英雄联盟的时候,很多人在说什么 ez mf noc ud tp 我就很纳闷他们在说啥,后来知道了这是美服关于英雄和技能的缩写,对于中国人来说要啥缩写 伊泽,女枪 魔腾 乌迪尔 传送就完事了, 当然这些缩写因为太出名,就跟DNA这个缩写一样,一直被沿用了
刚开始玩英雄联盟的时候,很多人在说什么 ez mf noc ud tp 我就很纳闷他们在说啥,后来知道了这是美服关于英雄和技能的缩写,对于中国人来说要啥缩写 伊泽,女枪 魔腾 乌迪尔 传送就完事了, 当然这些缩写因为太出名,就跟DNA这个缩写一样,一直被沿用了
上海匡慧网络科技有限公司 沪B2-20211235 沪ICP备2021021198号-6 Copyright ©2021 KUANGHUI All Rights Reserved. 匡慧公司 版权所有