032
英文名称: DISTRIBUTIONAL STRUCTURE
中文名称: 分布式结构
论文地址: https://www.tandfonline.com/doi/pdf/10.1080/00437956.1954.11659520
期刊/时间: 1954
分布式事实结构的可能性
- 首先,一种语言的各个部分不会任意地相对出现。
- 其次,类的限制性分布在其所有的出现中都持续存在。对于一个类别的特定成员相对于另一个类别的特定成员的出现,有必要根据样本中出现的频率,以概率的方式来表示。
- 其次,任何元素相对于任何其他元素的出现是有可能说明的,其准确程度如上所述,因此,说明可以涵盖一种语言的所有素材,而不需要其他类型信息的支持。
-
第四,对每个元素的相对出现的限制,最简单的描述是通过一个相互关联的陈述网络,其中某些陈述是以某些其他陈述的结果为基础的,而不是–通过对每个元素单独的总限制的简单测量。
- 在一种语言中,不仅有一套关于元素相对出现的事实,而且还有一套相对出现(即分布)的结构。
结构的真实性
存在两个问题
- 结构真的存在于语言中吗?
- 答案是肯定的,就像任何科学结构在它所描述的数据中真实存在一样:科学结构说明了一个关系网络,而这些关系在所调查的数据中真实存在。
- 该结构是否真的存在于说话者中?
- 在这里,我们面临着一个事实问题,在确定分布结构的过程中,并没有直接或充分调查这个问题。显然,说话者的某些行为表明,沿着分布结构的路线感知:例如,当人们模仿非语言或外语的声音时,他们会 "重复 "自己语言的话语(即他们通过他们听到的声音来重现话语,他们习惯于发音的特定对应变体;因此,听到的声音被视为对应集的成员)。也有证据表明,对声音的感知是以其形态音位成员关系为标准的。
- 一个合理的期望是,分布结构应该存在于说话者身上,反映他们的说话习惯。
分布与意义
是否有一个平行的 "意义结构"?
- 意义不是语言的独特属性,而是人类活动的一般特征。
- 语言与意义有着特殊的关系,既是在对经验的各个方面进行分类的意义上,也是在交流的意义上。
- 但这种关系并不简单。例如,我们可以把语言的结构与物理世界的结构(如微积分中用微分和积分表达的那种现象),或者与我们所知道的人类反应的结构(如联想、转移)进行比较
语素是由意义决定的吗?
一个词或语篇的语素构成可以通过每个音素序列相对于其他音素序列的出现来确定:例如,per, con相对于sist, tain;或/等相对于环境的各种特征,/z/
和/gi/
是相通的,但与/o
是相对的。关于语素分析的最终决定总是取决于音素序列的这种相对出现,因为语法接着会紧凑地说明语素的相对出现。
一个程序可以得到一个语词的大部分(如果不是全部)语素分段。概括地说:。
- 给出任何测试语料,联系许多第一音素与测试语料相同的语料;注意这些语料中第一音素之后有多少不同的音素。
- 然后考虑那些前两个音素与测试语词的前两个音素相同的语词,并注意在这些语词的前两个音素之后有多少不同的音素。以此类推。
- 如果在前n个音素之后,跟在第n个音素之后的不同音素的数量(在相关的语篇中)大于前n-1个音素之后的数量或前n+1个音素之后的数量,那么我们就在第n个音素之后放置一个暂定的语素边界。需要进行各种操作来纠正和检查每个结果的正确性;但是加上最后的模式化相对出现的测试,这就得到了一种语言的语素,而不需要参考任何意义或信息者的反应。
含义作为分布的函数
语言学家的工作正是为了发现这些属性,无论是为了描述性分析还是为了合成准语言系统。正如伦纳德-布卢姆菲尔德所指出的,经常发生的情况是,当我们不满足于某个东西是由于意义的解释时,我们发现它有一个形式上的规律性或 "解释"。在某种意义上,它可能仍然是 "由于意义 "的,但它符合一种分布的规律性
分布式分析
元素: 具有一定的分布(一组相对位置)
相似性: 一些元素在某些方面与其他元素相似;或者说,在这个意义上,如果我们将这些相似的元素分组("相似性分组"),一个集合的所有成员(相对于其他集合)的分布将是一样的。
依赖性: 对于每个元素,我们可以说任何包含它的语篇(或更短的领域)也会包含这样那样的其他类别。
可替代性(平行): 只要A和B在可置换域中具有相同(或部分相同)的环境X(X起初是元素,后来是元素的置换集),我们就把A和B归为一个置换集。
域: 所有关于依赖性和可替代性的陈述都适用于一些特定的领域,这个领域要么是由性质决定的(例如,一个语词前后的沉默),要么是由其中存在规律性的环境类型决定的
分布式关系
即使在那些过于个别而无法直接使用的分布事实中,也可以发现某些相关关系。
我们不可能列出每个特定名词后面的所有动词,或who
后面的所有动词。但我们可以说明名词的动词选择和who
的动词选择之间的关系如下:
- 我们在
The pianist
之后得到的动词与The pianist who
之后得到的动词基本相同,每个名词都是如此。 - 这意味着who的动词选择与who前面的名词的动词选择相同。
- 在这里有一个分布特征,将这种主语元素与普通名词区分开来
或者我们可以考虑提到的主动/被动关系。如果我们在英语中抽取大量的含有及物动词的句子。例如:The kids broke that window last week
- 我们可以引出由相同的动词组成的句子,但有被动语态,前后相同的名词,但顺序相反,句子的其余部分也相同。例如:
That window was broken by the kids last week
其中一些句子在文体上可能是笨拙的,所以如果涉及到一些特殊的绕口令,它们不会出现;但它们可以通过其他有效的诱导技术获得。相反,如果我们在没有被动的情况下寻求这种反转,我们将无法抽出许多句子。
- 我们可以得到
The kids saw Mary last week and Mary saw the kids last week
; 但是对于The kids saw the movie
我们不会得到The movie saw the kids
,即使这是符合语法的
或者,如果我们为break/will break
等寻求这种选择上的相似性(无论有无倒置),我们会发现对前面和后面的名词有相同的选择,但对句子的其他部分则不一定。The kids broke that window and The kids will break that window
, 但不是The kids will break that window last week or The kids broke that window if they don't watch out.
这样看来,只用普通语料库的分布信息,我们就可以找到主动动词和被动动词之间的关系,这种关系与-ed和will之间的关系不同。
分布的规律性本身可以成为研究的对象。
我们可以考虑在一种语言(或许多语言)中反复出现的依赖性和替代性类型,并在一个层次上发现 "主体 "和 "客体"(分布位置的语义名称)这样的关系,在更高的一般层次上发现 "成分 "和 "结构的头 "这样的关系(如果A
在环境X
中出现,而AB
也出现,但B
没有,那么A
就是AB
的头)。
我们可以考虑语法中允许替代分布分析的部分,并检查它们与语言变化和方言或特异功能的相互关系(因为可能每个语言结构都有一些结构上的变化点)。我们可以调查一种语言中那些具有生产性的部分的结构特征是什么。
此外,我们还可以调查许多语言结构中的相似点和不同点,以及语言系统与数学和逻辑 "语言"、手语、手势、密码、音乐等部分相似系统的区别。