第3章 第 3 章
語彙と文章 词汇和句子
甲田直美
1. はじめに 1. 引言
文章は、その多くは複数の連続する文によって実現される。文章が一貫性 ある内容として理解されるためには、語彙の選択と共起、表現の配列順序が強く影響する。このような局所結束性によって保証される文連鎖の自然なつ ながりに加え、文章は全体としての整合的全体像を持っている。ある特定の文章が随筆であったり、個人的手紙であったり、科学論文であったりすると き、文章全体としてその文章が所属する先をジャンルという。文章における語彙の選択や文体その他の言語特徴は、その文章のジャンル特性によって一定の傾向が見られる。文章是由多个连续的句子构成的。为了使文章被理解为具有一致性的内容,词汇的选择和共现、表达的排列顺序会产生很大影响。除了由这种局部连贯性所保证的句子链的自然联系外,文章整体上还具有一致的整体形象。当某一特定文章是散文、个人信件或科学论文时,文章整体所归属的类别称为体裁。文章中的词汇选择、文体及其他语言特征会因其体裁特性而呈现出一定的倾向。
ここに語彙と文章の関係として、2つの方向を見てとることができる。1 つは、局所結束性における語の選択、すなわち文章を構成する語から文章を考える方向である。もら 1 つは、文章の全体的特性から語彙の選択を考える方向、すなわち文章からそれを構成する語彙を考える方向である。本章で は、以上の 2 つの方向から語彙と文章の関係を考察する。在这里,可以从词汇和句子之间的关系中看到两个方向。一个是局部连贯性中的词语选择,即从构成句子的词语来考虑句子的方向。另一个是从句子的整体特性来考虑词汇的选择,即从句子来考虑构成它的词汇。本章将从以上两个方向探讨词汇与句子之间的关系。
文章といら場合、通常書き言葉を指して用いられる場合が多いが、本章で扱ら結束性は書き言葉に限ったことではない。話し言葉においても講演な ど、一連の発話によって一定の内容が話される場合にも全体としての整合文章和口语的结合性不仅限于书面语言。在口语中,例如在演讲中,通过一系列发言传达一定内容时,也存在整体的一致性。
性、話のまとまりをもっている。結束性とは、書き言葉(文章)と話し言葉(談話)に共通する概念である。本章では書き言葉と話し言葉に共通する、特性 としての言語単位を「テクスト」とよび、「文章」と区別する。性、话的连贯性。连贯性是书面语言(文章)和口头语言(谈话)共有的概念。本章将书面语言和口头语言共有的特性作为语言单位称为“文本”,并与“文章”区分开来。
以下第 2 節ではテクストにおける語啚のあり方について扱ら。第 3 節以降ではテクストの特性によって使用される語彙が異なる現象について、レジ スター、ジャンル、スタイルと使用される言語との対応、その要因について扱ら。以下第 2 节将讨论文本中词汇的存在方式。第 3 节及以后将讨论由于文本特性而使用的词汇不同的现象,包括语域、体裁、风格与所使用语言之间的对应及其因素。
2. 結束性における語彙 2. 结束性中的词汇
2.1. 語とテクスト 2.1. 语言与文本
テクストが全体として一貫性ある、整合性を備えた内容であること、すな わち結束性を支える言語的要素の 1 つに語彙の選択がある。整合性 (coherence)とは言語的要素に限らず、推論、前提知識等の非言語的要素に よる貢献を含めたテクストのつながりの良さを表す概念である。これに対 し、結束性(cohesion)とは、Halliday and Hasan (1976) で述べられるようにテ クストの整合性を支える言語的要素を指す。文本整体上具有一致性和连贯性,其中支撑连贯性的语言要素之一是词汇的选择。连贯性(coherence)是一个概念,表示文本的连接良好,包括语言要素以外的推理、前提知识等非语言要素的贡献。相对而言,连结性(cohesion)是指支撑文本连贯性的语言要素,如 Halliday 和 Hasan(1976)所述。
次の例では、同一語の繰り返し(マングローブ、海、浚渫)や関連語(海水〜海峡〜海)、部分全体関係(木
→
→
rarr \rightarrow 根)、指示(マングローブ それ)が用いら れ、一貫した話題が取り上げられていることが分かる。マングローブ/木に関する語に下線 i、海に下線 ii、浚渫に下線iiiを付した。
在下一个例子中,可以看出使用了同一词的重复(红树林、海洋、疏浚)或相关词(海水〜海峡〜海)、部分与整体关系(树
→
→
rarr \rightarrow 根)、指示(红树林 它),从而提出了一个一致的话题。对与红树林/树相关的词进行了下划线 i,对海洋进行了下划线 ii,对疏浚进行了下划线 iii。
(1) マングローブi といらのは海
i
i
i
i
_(ii) { }_{i i} 水にも生える木
i
i
_(i) { }_{i} です。全部で四O種類か五〇種類ぐらいありますが、それ 华が根 i を張って、だんだん海ii のほうへ出て行く。つまり、マングローブ i といらのは、土地を造成 しながら増えていく。
(1)红树林和滩涂是生长在海水中的树木。总共有四十种或五十种左右,但它们的根逐渐向海里延伸。也就是说,红树林和滩涂在造地的同时不断增加。
だから現在でもマラッカ海峡 ii は浚渫 iii されているのです。浚渫iii し なければ、おそらく数千年もすればふさがってしまらのではないか、 といら海
i
i
i
i
^(ii) { }^{i i} なのです。
所以即使在现在,马六甲海峡仍在进行疏浚。如果不进行疏浚,恐怕过几千年就会被堵塞。
(鶴見良行『東南アジアを知る一私の方法—』1995年、岩波書店、p.60.)
(鶴见良行《东南亚を知る一私の方法—》1995 年,岩波书店,p.60.)
さらに名詞句の連鎖だけではなく、上記の文脈ではマングローブについ て、それが「海水にも生え」「根を張り」「土地を造成し」、それゅえ「浚渫」 しなければならないと、述語(下線で示した)で描かれる事象は論理的に一貫 している。
此外,不仅仅是名词短语的连锁,在上述语境中,关于红树林,它“生长在海水中”、“扎根”、“造地”,而且“必须进行疏浚”,用谓语(下划线所示)描绘的现象在逻辑上是一致的。
Halliday and Hasan(1976)では結束性を語彙的結束性と文法的結束性に区分して整理している。他方の解釈が他方の解釈に依存することによって、結東性が形成される。
Halliday 和 Hasan(1976)将连贯性分为词汇连贯性和语法连贯性。另一种解释依赖于另一种解释,从而形成连贯性。
語彙的指示の同一性には以下の 4 つのタイプがある(Halliday and Hasan 1976)。
语义指示的同一性有以下四种类型(Halliday and Hasan 1976)。
(2)語彙的結束性
(2)词汇的结束性
(a)同一語(繰り返し)(例:マングローブ~マングローブ;浚渫~浚渫)
(a)同一语(重复)(例:红树林~红树林;疏浚~疏浚)
(b) 同義語(または近似同義語)(例:少年
→
→
rarr \rightarrow 男の子)
(b) 同义词(或近似同义词)(例:少年
→
→
rarr \rightarrow 男孩)
© 上位語(例:マングローブ
→
→
rarr \rightarrow 木)
© 上位语(例:红树林
→
→
rarr \rightarrow 树)
(d)一般語(例:こと、もの)
一般语(例:こと、もの)
結束性にはこのような語彙的結束性の他に文法的結束性があり、後者の手段として「指示」「代用」「省略」「接続」がある(Halliday and Hasan 1976)。一方の解釈を文脈上の他の語を前提として理解するとき、2つの要素が統合 され、結束性が生まれる。结束性除了这种词汇性结束性外,还有语法性结束性,后者的手段包括“指示”“代用”“省略”“连接”(Halliday and Hasan 1976)。另一方面,当理解一个解释时以上下文中的其他词为前提,两个要素就会整合,产生结束性。
Halliday and Hasan(1976)では語彙的結束性と文法的結束性は区別されて いるが、実際にテクスト内で指示の連鎖がどのように表示されるかの選択に関わるものとして接近可能性(Ariel 1988, Gundel et al. 1993)がある。例(1) では「マングローブ」を示すのに、同一語をそのまま繰り返す場合と指示語「それ」で受ける場合とがある。Halliday and Hasan(1976)によれば同一語の繰り返しは語彙的結束性、指示語で受ける場合は文法的結束性ということに なる。しかし実際の使用ではこれらは共通して結束性を支えており、連続しHalliday 和 Hasan(1976)区分了词汇连贯性和语法连贯性,但实际上与文本中指示链如何呈现的选择相关的是可接近性(Ariel 1988, Gundel 等,1993)。在例(1)中,有直接重复同一词“红树林”的情况,也有用指示词“它”来指代的情况。根据 Halliday 和 Hasan(1976),同一词的重复被视为词汇连贯性,而用指示词指代则被视为语法连贯性。然而在实际使用中,这些共同支撑着连贯性,并且连续性
ている。 正在。
Gundel et al. (1993)は、「既知性の階層」によって、it / that / this / the /a noun などの指示の連続の問題を扱っている。そこでは、記憶の問題をその特徴として考え、認知処理の合図句として指示語を扱っている。Gundel et al. (1993)提到通过“已知性的层次”来处理 it / that / this / the / a noun 等指示的连续性问题。在这里,记忆问题被视为其特征,并将指示词作为认知处理的信号词。
表1 既知性の階層(Gundel et al. 1993)表 1 既知性层次(Gundel et al. 1993)
in forcus
{it} | in forcus |
| :--- |
| {it} |
>
activated
{
that
}
{
this
}
{
this
N
}
>
activated
{
that
}
{
this
}
{
this
N
}
{:[ > " activated "],[{" that "}],[{" this "}],[{" this "N}]:} \begin{gathered} >\text { activated } \\ \{\text { that }\} \\ \{\text { this }\} \\ \{\text { this } \mathrm{N}\} \end{gathered}
>
>
> > 熟悉{那 N}
> familiar
{that N} | $>$ familiar |
| :--- |
| {that N} |
>
>
> > uniquely identifiable {the N }
>
>
> > 唯一可识别 {the N }
>
>
> > referential {indefinite this N }
>
>
> > 参考 {不定的这个 N }
>
>
> > 类型可识别
{
a
N
}
{
a
N
}
{aN} \{a \mathrm{~N}\}
>
>
> > type identifiable
{
a
N
}
{
a
N
}
{aN} \{a \mathrm{~N}\}
> type identifiable
{aN} | $>$ type identifiable |
| :--- |
| $\{a \mathrm{~N}\}$ |
"in forcus
{it}" " > activated
{ that }
{ this }
{ this N}" "> familiar
{that N}" > uniquely identifiable {the N }
> referential {indefinite this N } "> type identifiable
{aN}" | in forcus <br> {it} | $\begin{gathered} >\text { activated } \\ \{\text { that }\} \\ \{\text { this }\} \\ \{\text { this } \mathrm{N}\} \end{gathered}$ | $>$ familiar <br> {that N} | $>$ uniquely identifiable {the N } | |
| :---: | :---: | :---: | :---: | :---: |
| | | | $>$ referential {indefinite this N } | $>$ type identifiable <br> $\{a \mathrm{~N}\}$ |
この階層は 6 種の「認知的地位」からなり、それぞれは該当する指示語を使うときの必要十分条件(下位(右)の地位をすべて包含する)と考えられてい る。这个层次由 6 种“认知地位”组成,每种地位被认为是使用相应指示词时的必要充分条件(包含所有下位(右)地位)。
指示の連鎖について、名詞句の処理を考える上で見込みのある分析は、名詞句の持つ情報へのアクセスの難易を考えるものである。アクセスの容易さ とは、先行詞の呼び出し可能度で、前文の焦点、フォーカスにあたる部分 が、指示表現の先行詞として最も呼び出し可能度が高い、つまり、先行詞に なる可能性が一番高い(Langacker 1997)等、広く支持されている。关于指示的连锁,在考虑名词短语的处理时,有前景的分析是考虑名词短语所包含信息的访问难度。访问的容易性是指先行词的可调用性,前文的焦点部分作为指示表达的先行词具有最高的可调用性,也就是说,成为先行词的可能性最高(Langacker 1997)等,得到了广泛的支持。
Ariel(1988)は指示語や名詞句の連鎖の仕方を指示対象への接近可能性と して捉えている。指示対象を復元するために、接近しにくい指示対象は詳し く表現する必要があり、逆に接近しやすい指示対象は簡略な表現が選ばれる として、固有名詞から this / that / it / s/he / gaps, pro, reflexive などの使い分 けを論じている。Ariel(1988)将指示语和名词短语的连锁方式视为指示对象的接近可能性。为了恢复指示对象,接近困难的指示对象需要详细表达,而相反,接近容易的指示对象则选择简略的表达,讨论了从专有名词到 this / that / it / s/he / gaps, pro, reflexive 等的使用区分。
テクストにおける視点のとり方やテクストの自然な連鎖を特徴づける名訶句の連鎖についての現象は、これまでの言語的知識の自律性を前提とする言語学の研究では規則性が見いだしにくいものである。そのため、言語構造に とどまらず、記憶システムや情報構造等を視野に入れた研究が行われてい在文本中视角的处理和特征化文本自然连锁的名句连锁现象,在以往假设语言知识自律性的语言学研究中难以发现规律。因此,研究不仅局限于语言结构,还包括记忆系统和信息结构等方面。
る。あるモノを示すとき、言語表現のバリエーションとしては、より詳しく定義した記述によって説明する、名詞を用いる、名詞の短い形を用いる、代名詞や省略された名詞として指し示す、などが存在する。どのような指示対象が接近しやすく、どのような指示対象が接近しにくいのかといらと、直前 で述べられた表現は記憶に残っており接近しやすいものであり、離れたとこ ろで述べられた表現は接近しにくい。示したい表現が、同一文内、直前の文、同じパラグラフ内、パラグラフを超えて存在するといら、テクストにお ける指示対象との距離によって、代名詞や指示、確定記述などの用いられ方 が決定される。接近可能性の高低には、記憶(短期記憶、長期記憶)、発話状況などの物理的状況、その名詞句のテクスト • 談話における価值(主題か,否 か)といら言語的文脈が影響している。このことは逆に、指示表現がより簡略な形で記述されていれば、その先行詞は近いところにあり、より詳細に記述されていれば、広いスコープから先行詞は見つけられるといえる。当提到某个事物时,语言表达的变体包括通过更详细的定义描述来解释、使用名词、使用名词的简短形式、作为代名词或省略名词来指示等。哪些指示对象更容易接近,哪些指示对象更难接近,前面提到的表达更容易被记住并接近,而在远处提到的表达则更难接近。如果想要表达的内容在同一句话中、前一句话中、同一段落内或跨段落存在,那么在文本中指示对象的距离将决定代名词、指示词、确定性描述等的使用方式。接近可能性的高低受到记忆(短期记忆、长期记忆)、发话情况等物理状况,以及该名词短语在文本和话语中的价值(是否为主题)和语言上下文的影响。反过来,如果指示表达以更简略的形式描述,那么其先行词就会在较近的地方;如果描述得更详细,则可以从更广泛的范围找到先行词。
2.2. 文脈の流れと語の結束性 2.2. 文脉的流动与词的连贯性
次の例では 2 つの命題が同一語を共有しており、語彙的に結束性が表示さ れる。分かりやすい表現として、前の文中にある表現を意味的に重複させる ことは、表現の結束性を高める。在下一个例子中,两个命题共享相同的词,显示出词汇上的连贯性。作为一种易于理解的表达方式,在前面的句子中重复出现的表达在语义上是重叠的,这提高了表达的连贯性。
(3) 私たちはトランクからビールを取り出した。ビールはなまぬるかっ た。(3) 我们从行李箱里拿出了啤酒。啤酒是温的。
これに対し、先行詞が文脈をさかのぼって存在しない場合、推論によって現在読んでいる表現を文脈をさかのぼった表現に関係づけることがある。こ のような推論を文脈をさかのぼるので逆行推論、あるいは橋渡し推論とい 5。次の例(4)では先行する文と重複する項目がないが、先行文と後続文の関係は「ピクニックの荷物の中にはビールが入っていた」という推論によっ て補われている。对此,如果先行词在上下文中不存在,可能会通过推理将当前阅读的表达与上下文中的表达联系起来。这种推理被称为逆向推理或桥接推理。在下一个例子(4)中,前面的句子没有重复的项,但前后句的关系通过“野餐的行李中有啤酒”这一推理得到了补充。
(4)私たちはピクニックの荷物の中を調べた。ビールはなまぬるかった。 (Haviland and Clark 1974)(4)我们检查了野餐的行李。啤酒是温的。
例(3)のようにビールという表現が前後の表現に共通している場合は、こ の「ビール」が既知情報となり、理解されやすい(Haviland and Clark 1974)。明示的項を共有しない(4)において、その理解のしやすさは、「ビラ ニックの荷物」として「ビール」が入っているのがどの程度あり得るかによ る。このように結束性の理解のしやすさは、事象としてどの程度あり得る か、連想のしやすさに基づいている。例(3)的表达中“啤酒”在前后表达中是共同的,因此这个“啤酒”成为已知信息,更容易理解(Haviland and Clark 1974)。在没有明确共享项的情况下(4),理解的容易程度取决于“比拉尼克的行李”中包含“啤酒”的可能性。这种连贯性的理解容易程度基于事件的可能性和联想的容易程度。
語彙間の関連について、より連想しやすい単語であれば表現の連鎖として読解が容易になると考えられている。人間の保有する知識がどのように体系化されているかについて、Collins and Quillian (1969) による当初のモデルは次のようなものであった(図 1)。语汇间的相关性,如果是更容易联想的单词,就会被认为作为表达的连锁使理解变得容易。关于人类所拥有的知识是如何系统化的,Collins 和 Quillian (1969) 的最初模型如下所示(图 1)。
当初の理論では、概念の階層関係(上位 • 包含関係)を初めとする意味関係 のリンクが考えられていた。しかし概念間の関係は階層関係に基づいたもの ではないといら否定的なデータが出され、その後のモデルでは、階層関係で
当初的理论认为,概念的层次关系(上位 • 包含关系)作为意义关系的链接。然而,关于概念之间的关系并不是基于层次关系的否定性数据被提出,在后来的模型中,层次关系被
図1階層性に基づく記憶構造の仮想図(Collins and Quillian 1969)图 1 基于层次性的记忆结构的虚拟图(Collins and Quillian 1969)
はなく連想関係に基づく、語の意味をネットワーク的つながりによって考え る活性化拡散モデル(spreading activation model)(Collins and Loftus 1975)が想定されている(図2)。基于联想关系的,通过网络连接思考词义的活化扩散模型(spreading activation model)(Collins and Loftus 1975)被设想(图 2)。
リンクの移動距離が多くなれば、それだけ情報の検索に時間がかかり、リ ンク間のつながりには、強さや伝達の時間についての異なる接近可能性があ ると考えられている。接近可能性は、人が概念の特性をどれくらい考え、使用しているかによって決まる。もし2つの概念の間に共通性が多ければ、リ ンクも多く張り巡らされているよら図示されている。链接的移动距离越大,信息搜索所需的时间就越长,链接之间的连接在强度和传递时间上可能存在不同的接近可能性。接近可能性取决于人们对概念特性的思考和使用程度。如果两个概念之间的共性越多,链接也会越多,如图所示。
概念の活性化は整合性ある全体像の構築には必須のものである。次の表現 を理解するためには前後件「布が破れた」と「干し草の山が重要だった」の関係がなぜ結びついているのかが理解できなくてはならない。
概念的活化是构建一致性整体图像所必需的。要理解下述表达,必须理解前后件“布破了”和“干草堆很重要”之间的关系为何相互关联。
(5)布が破れたから干し草の山は重要だった。
(5)布破了,所以干草堆很重要。
(Bransford and Johnson 1973)
図2 活性化拡散モデルに基づいて概念間の関係を図示したもの (Collins and Loftus 1975)图 2 基于激活扩散模型的概念间关系示意图 (Collins and Loftus 1975)
前後を結びつける手がかり「パラシュート」が与えられると、〔パラシュー トの〕布が破れ、〔落下した〕ため、〔クッションとして〕干し草の山が重要 だったといら解釈をすることができる。表現を構成する個々の語彙が既知の ものであっても、それらを結びつける概念が活性化していなければ理解しか らいものとなる。ブランスフォードとジョンソン(Bransford and Johnson 1972)はこの他にも、テクスト理解において入カデータを予想や仮説、期待 などのもとに処理していく、高次の水準にある概念の駆動の重要性を示して いる。例えば「洗濯」についての文章を「洗濯物」「衣類」等の単語を使わ ずに、抽象的な語を用いて「洗濯」についての知識の活性化を避けるような テクストの読解を調べ、知識を駆動させながら全体として意味ある全体像を求めて理解する様子を示している。このような概念駆動処理は既有知識に倲存することが大きい。これに対し、洗濯に関する語彙が用いられ、個々の語彙からテクストの全体像が喚起される場合には、感覚入力のデータから処理 は始まり、徐々に大きな枠組みの処理へと移行していくので、データ駆動処理と呼ばれる。前后结合的线索“降落伞”被给予后,〔降落伞的〕布料破裂,〔因而落下〕,〔作为缓冲〕的干草堆变得重要。即使构成表达的个别词汇是已知的,如果连接它们的概念没有被激活,就会变得难以理解。布兰斯福德和约翰逊(Bransford and Johnson 1972)还表明,在文本理解中,输入数据是基于预测、假设、期待等进行处理的,高层次概念驱动的重要性。例如,关于“洗衣”的文章不使用“洗衣物”、“衣物”等词,而是用抽象的词汇来避免激活关于“洗衣”的知识,研究了在驱动知识的同时,整体上寻求有意义的整体图像的理解过程。这种概念驱动处理在现有知识中占据很大比重。相对而言,当使用与洗衣相关的词汇时,从个别词汇中唤起文本的整体图像,处理从感官输入的数据开始,逐渐过渡到更大的框架处理,因此被称为数据驱动处理。
2.3. 多義語の理解 2.3. 多义词的理解
次の例では、「センタク」は意味が同定できないようカタカナで書かれて いる。在下一个例子中,“センタク”用片假名书写,似乎无法确定其含义。
(6)センタクをしようにもろくな石鹸がない。仕方がないので石鹸はやめ てサラダ油にした。(6)虽然想选择,但没有好的肥皂。没办法,只好放弃肥皂,改用沙拉油。
(守 1996)
「センタク」の意味として、第1文内にある「石鹸」と整合性をとろうと して「洗濯」を意味として当てるが、続く第2文の「サラダ油」に出会い、想定していた「洗䍜」がキャンセルされ、お中元やお歳暮などの贈り物を選 ぶ際の「選択」を当てはめる。そらすると、全体として意味を成す。「セン タク」のように複数の意味を持つ曖昧語が、文脈を読み進めることによって意味がはっきりすることがあるが、多義語の解釈では、曖昧さを解消するま“センタク”的意思是,在第一句中与“石鹸”保持一致,意指“洗濯”,但在接下来的第二句中遇到“サラダ油”,原本预想的“洗濯”被取消,转而适用于选择中元和岁暮等礼物时的“选择”。这样一来,整体上就形成了意义。像“センタク”这样具有多重意义的模糊词,通过继续阅读上下文,有时会使意义变得明确,但在多义词的解释中,消除模糊性。
で複数の意味を保持しておかなければならない。つまり、文を読みながら多義語の意味を保持していることになる。しかし、多義語の複数の意味を保持 しておくことができるのは比較的短い間(石王 2001)だけで、多くの処理と時間を求められる場合には、結局一方の意味にしか焦点を当てることができ ないと考えられている。曖昧な表現を、曖昧なままにしておくと処理に負担 がかかることになる。必须保持多个含义。换句话说,在阅读句子的同时,必须保持多义词的含义。然而,能够保持多义词的多个含义的时间相对较短(石王 2001),在需要大量处理和时间的情况下,最终只能集中于其中一个含义。将模糊的表达保持模糊会增加处理的负担。
文脈の理解はテクスト読解中に漸次的に進展するものであり、同様に表現間の結束性も文脈内での価値によって決定される。すなわち結束性は表現間 の意味関係に内在する特性ではなくて特定の文脈によって語義の特定の部分 が活性化されることによって生じるものである。语境的理解是在文本阅读中逐渐发展的,同样,表达之间的连贯性也由语境中的价值决定。换句话说,连贯性不是表达之间意义关系内在的特性,而是通过特定语境激活词义的特定部分而产生的。
2.4. おわりに 2.4. 结束
以上、本節では結束性における語彙について考察した。語の繰り返しや指示語による同一性の保持は結束性にとって重要な要素だが、テクスト内の語 と語の関係は、あらかじめ語が保有する概念によって自然な連鎖が保証され ているといらよりも、そのテクスト内で活性化された意味によって臨時的に結束性が保たれている。また、語の表示の仕方として名詞をそのまま用い る、代名詞、「この/その/あの」等を付加する等の選択は、言語使用者の テクスト内での接近可能性に関係している。以上,本节讨论了连贯性中的词汇。词语的重复和指示词所保持的同一性是连贯性的重要因素,但文本中词与词之间的关系,更多是由词所固有的概念所保证的自然链条,而不是由文本中激活的意义临时保持的连贯性。此外,作为词的表现方式,直接使用名词、代名词,以及添加“这个/那个/那些”等的选择,与语言使用者在文本中的接近性有关。
3. レジスター、ジャンル、スタイル 3. 收银机、类型、风格
テクストの分析においては、言語構造上の特徴がテクストとして具現化す ることが問題であり、具現化の条件として、言語使用域(レジスター: register) を考えることができる(岡野 1997)。在文本分析中,语言结构上的特征作为文本的具现化是一个问题,而作为具现化的条件,可以考虑语言使用域(注册:register)(冈野 1997)。
言語の使用域は本節以下で述べるようにレジスターといらが、話し言葉と書き言葉もレジスターを構成する要因のらちで伝達様式の違いによるもので ある。第4節以降では、レジスターを構成するどのような要因によって用い られる語彚に違いが生じるのか考察するが、その前に、レジスターとジャン语言的使用范围如本节以下所述,注册和口语与书面语也是构成注册的因素之一,传达方式的不同导致了这些差异。在第 4 节及以后,将探讨构成注册的哪些因素导致使用的词汇出现差异,但在此之前,注册与类型。
ル、スタイルについて本節で述べておく。 关于风格,本节将进行说明。
レジスターとジャンル、スタイルはどれもテクストの特徴と強く関わって おり、概念間で近接、類似する点も多い。しかし、これらの概念の違いを述 べることは、テクストの成り立ちを分析する上で非常に有用である。Biber and Conrad (2009) では、これらの概念間の違いが適格に述べられており、 これをもとに概念間の異同について以下に示す。注册和类型、风格都与文本的特征密切相关,概念之间也有许多相似之处。然而,阐述这些概念的差异在分析文本的构成时非常有用。Biber 和 Conrad(2009)中对这些概念之间的差异进行了恰当的描述,以下将基于此展示概念之间的异同。
ジャンルといら用語は、芸術作品や文学で用いられているように、詩、ト゚ ラマ、フィクションなど類型的にまとめられた 1 つのカテゴリーを指す。ジャンル和术语是指在艺术作品和文学中使用的,像诗、戏剧、小说等类型性地归纳的一个类别。
これに対してレジスターは、あるテクストが示す言語的特徴を生み出す諸条件の集まり(岡野 1997)である。諸条件とは、例えば伝達様式(話し言葉 か、書き言葉か)、参加者の関係、話題、場面、目的等を指し、これらの違 いによって言語的特徴が生み出される。例えば、以下のような要素が要因と して考えられる。对此,语域是产生某一文本所示语言特征的各种条件的集合(冈野 1997)。这些条件包括传达方式(口语或书面语)、参与者的关系、话题、场景、目的等,这些差异导致了语言特征的产生。例如,以下这些要素可以被视为因素。
(7)言語が用いられる状況のパラメター(Biber 1993)(7)语言使用情境的参数(Biber 1993)
伝達チャネル:書かれた/話された/台本のある話 传达渠道:书面/口头/有剧本的谈话
フォーマット:出版された/出版されていない 格式:已出版/未出版
設定 : 制度上の/公共の/個人的な 设置 : 制度上的/公共的/个人的
受け手
(a) 複数:不特定多数/複数/個人/自己 (a) 多个:不特定多数/多个/个人/自己
(b)実現(場所と時間):存在する/しない (b)实现(地点和时间):存在/不存在
© 相互作用:全くない/少し/最大 © 相互作用:全无/少许/最大
(d) 共有知識:一般/特定/個人的 (d) 共有知识:一般/特定/个人的
送り手 发送者
(a)人口統計学上のバリエーション:性別、年齢、職業等(a)人口统计学上的变异:性别、年龄、职业等
(b)承認:承認された個人/制度 (b)承认:承认的个人/制度
事実性:事実に基づいた情報/中間か不確定/想像 事实性:基于事实的信息/中间或不确定/想象
目的:説得する/楽しませる/啓発する/知らせる/教える/説明 する/語る/記述する/記録を採る……。目的:说服/娱乐/启发/通知/教导/解释/讲述/描述/记录……。
話題 话题
岡野(1997)が述べるように、レジスターは、場面の脈絡の要素が多様に変化するのに際して、テクストの文体ないし言語的特徴に及ぶ作用の如何を見いだすための指標である。レジスターを検討することにより、異なるレジ スターでの言語的違いや、それを生み出す要因について検討することができ る。冈野(1997)指出,语域是一个指标,用于发现场景脉络要素多样变化时对文本的文体或语言特征的影响。通过研究语域,可以考察不同语域中的语言差异及其产生的因素。
Biber and Conrad (2009) で述べられているように、レジスター分析におけ る体系的な言語パターンは、言語のバリエーションが機能的であるから存在 する。ある特定のレジスターで使われる言語特徴はそのレジスターの状況的特徴によって要求されるときに使われる。例えば、話し言葉における言い誤 りや情報の断片化は、話し言葉の即興性や非計画性に起因し、書き言葉にお ける係り受けの呼応や一文の長さは書き言葉の計画性や視覚的に保持されや すいことに起因する。正如 Biber 和 Conrad(2009)所述,注册分析中的系统语言模式之所以存在,是因为语言的变异具有功能性。在特定的注册中使用的语言特征是在该注册的情境特征要求时使用的。例如,口语中的错误和信息的片段化源于口语的即兴性和非计划性,而书面语中的依存关系的呼应和句子的长度则源于书面语的计划性和视觉上易于保持。
これに対して、スタイルについての言語パターンは、Biber and Conrad (2009)が述べるように、機能的なものではなく、個人の選択に関するもの である。話者や筆者が良いスタイルと考える態度があり、そこからの選択で使われるものである。ある筆者は長い文を好み、ある筆者、例えばアーネス ト • ヘミグウェイは短い単純な文を好むといったように、使用状況から決定されるものではなく、個人の選択と関与している。对此,关于风格的语言模式,如 Biber 和 Conrad(2009)所述,并不是功能性的,而是与个人选择有关。说话者或作者对良好风格的态度,以及从中做出的选择,都是基于此。某些作者喜欢长句,而其他作者,例如厄内斯特·海明威,则喜欢短而简单的句子,这并不是由使用情况决定的,而是与个人选择和参与有关。
Biber and Conrad(2009)はレジスター、ジャンル、スタイルといら言葉を テクストのバラエティを扱ら異なる観点と捉えている。同じテクストがレジ スター、ジャンル、スタイルの観点から分析されらる。例えば、あるテクス トが科学論文だとすると、そのテクストは慣習としてタイトル、著者名、要約、序論、方法、結果、議論、結論、そして参考文献といった構成を成して いると想定される。ジャンルの観点からいらと、これらの構成を共通して持 つ点で共通したジャンル、「科学論文」に分類される。レジスターの観点か ら分析すると、書き方において長い名詞句、名詞化、受動態などの難解さ は、典型的な研究論文の伝達目的と執筆の状況に基づいて説明されらる。そ比伯和康拉德(2009)将语域、体裁、风格等词视为处理文本多样性的不同视角。同一文本可以从语域、体裁、风格的角度进行分析。例如,如果某个文本是科学论文,那么可以假设该文本作为惯例包含标题、作者名、摘要、引言、方法、结果、讨论、结论以及参考文献等结构。从体裁的角度来看,这些结构在共同点上被归类为“科学论文”。从语域的角度分析,写作中长名词短语、名词化、被动语态等的复杂性可以根据典型研究论文的传达目的和写作情境进行解释。
して同様のテクストはスタイルの観点からいらと、特定の著者や特定の分野、歴史的時代で "良い"あるいは効果的と考えられている書き方を㲘坉し たと考えることができる。可以认为,类似的文本从风格的角度来看,反映了特定作者、特定领域或历史时代被认为“好”或有效的写作方式。
レジスターとは、テクスト中に見られる言語特徴とテクストが生み出され た使用状況を組み合わせて分析するのに用いられる。テクスト中に見られる言語特徴は、テクスト内から切り取った部分的な特徴でもあり得る。スタィ ルもまた同様に、テクスト内に見られる表現の選択を指すため、部分的な特徴であり得る。これに対しジャンルといら概念は、あるバラエティ内でのテ クスト全体を構成する構造や、テクスト全体の構造に用いられる言語構造に用いられる。レジスターやスタイルがテクストの一部分に基づいて分析され うるのに対して、ジャンルはあるテクスト全体が他のテクストとどう異なる かとか、テクスト全体の位置づけをする際に用いられる概念である。いかな るテクストの断片もレジスターの観点から分析されらるし、テクスト全体の ジャンル分析はレジスターの分析からも分析されらるが、ジャンル分析はテ クストの断片に対してではなく全体に対して行われる。注册是用来分析文本中可见的语言特征与文本产生的使用情况的结合。文本中可见的语言特征也可以是从文本中切割下来的部分特征。风格同样指的是文本中可见的表达选择,因此也可以是部分特征。与此相对,体裁和概念是用于构成某一变体内的文本整体的结构,或用于文本整体结构的语言结构。注册和风格可以基于文本的一部分进行分析,而体裁则是用于描述某一文本整体与其他文本的不同之处,或在对文本整体进行定位时使用的概念。任何文本的片段都可以从注册的角度进行分析,文本整体的体裁分析也可以从注册的分析中进行,但体裁分析是针对文本的整体而非片段进行的。
4. テクスト特性の規定因 4. 文本特性规定因
4.1. テクストの外部付与情報と内部充足情報 4.1. 文本的外部赋予信息和内部满足信息
ある資料に含まれる語彙や文法、テクストの型は、そこで使用された語 についての性質であり、EAGLES(1996)でいら内部充足情報にあたる。文章が持つ参照情報として、EAGLES(1996)、佐野(他)(2009)では、文章の外部付与情報と内部充足情報の区別を行っている。コーパス研究の進展 に伴い、コーパスに収納される文書に付与する情報の吟味と厳選が進められ ている(佐野(他)2009)。コーパスに納められる言語の特性は内部充足情報 と呼ばれ、文章内に繰り返し現れる言語表現のパターンや、文章構造、 ピック、文章スタイルを指す。これに対し、外部付与情報とは、NDC(日本十進分類法)等によるジャンル情報、Cコード(日本図書コード)による腯売対象、発売形態や、著者の属性や発行年等、奥付等から読み取られる情潞某些资料中包含的词汇、语法和文本类型是关于所使用词语的性质,属于 EAGLES(1996)中的内部充足信息。作为文章所具有的参考信息,EAGLES(1996)和佐野(他)(2009)区分了文章的外部赋予信息和内部充足信息。随着语料库研究的进展,正在对存储在语料库中的文档所赋予的信息进行审查和筛选(佐野(他)2009)。存储在语料库中的语言特性被称为内部充足信息,指的是在文章中反复出现的语言表达模式、文章结构、选择和文章风格。相对而言,外部赋予信息是指通过 NDC(日本十进分类法)等获得的类别信息、通过 C 代码(日本图书代码)获得的销售对象、发行形式,以及作者的属性和出版年份等,从书籍的扉页等处获取的信息。
で、文章の目的(情報伝達、議論、㛱楽、教科書等の教育)や社会的設定、言語のコミュニケーション上の機能を推し量るための情報である。这是为了推测文章的目的(信息传达、讨论、娱乐、教科书等教育)以及社会设置、语言在交流中的功能的信息。
(8)言語を分類する基準(EAGLES 1996)(8)语言分类标准(EAGLES 1996)
(1)内部的:言語内で繰り返し生じる言語のパターン内部的:言语内重复出现的语言模式
1.トピック 1.话题
2. スタイル:外部のパラメターと関連があると考えられる言語パター ン2. 风格:与外部参数相关的语言模式
②外部的:参加者の状況、社会的設定、言語のコミュニケーション上 の機能外部的:参与者的状况、社会设置、语言交流的功能
参加者:著者、編集者、出版社、筆者の創作年代、性別、言語背景、住所参与者:作者、编辑、出版社、笔者的创作年代、性别、语言背景、地址
出版物なら:ノンフィクションかフィクションか、分野出版物的话:非虚构还是虚构,领域
装丁
聞き手 听众
聞き手のサイズ:5 名以下、5-20、21-50、100、1000听众规模:5 名以下、5-20、21-50、100、1000
聞き手の特性:一般、素人、プロ、専門家、学生 听众的特性:一般、外行、专业人士、专家、学生
発信者と聞き手との関係:距離、遠い • 近い 发信者和听者之间的关系:距离,远 • 近
情報:テクストがこの目的のみのために創作されることはめったに ない。参照要約のために、等。信息:文本很少是为了这个目的而创作的。用于参考摘要等。
議論 议论
推薦 推荐
楽しませる:フィクション(小説、歴史、ノンフィクション、伝記、自叙伝、手紙)娱乐:虚构(小说、历史、非虚构、传记、自传、信件)
宗教
インストラクション(学術論文、教科書、実用) 指令(学术论文、教科书、实用)
例えば、参与者の情報として、著者、編集者、出版社、筆者の創作年代、例如,作为参与者的信息,包括作者、编辑、出版社、作者的创作年代,
性別、言語背景、住所があるが、これらは外部付与情報である。また、受け手の人数や特性(一般、素人、プロ、専門家、学生)や発信者と受け手との関係(距離:遠い • 近い)も挙げられている。佐野(他)(2009)では読み手とし てその書物の販売対象として書物に付与されるCコードの利用可能性を述 べている。Cコードでは、販売対象(1桁目)が、一般、教養、実用、専門、婦人、学参(小中/高校)、児童、雑誌扱いに分類されている。販売対象カテ ゴリ間のテクストの性質が語彙密度に影響しており、販売対象が児童や一般 の場合、語彙密度が低くなる傾向がある一方、「専門」の場合、語彙密度が高くなるとされる。Cコードの販売対象がこれに類似する情報として利用可能であるが、BCCWJ に含まれるサンプルの大部分が「一般」と分類されて おり、「販売対象」の情報だけではテクスト間の違いは捉えられないとされ ている。一般の中でも専門性、非専門性の中で語彙密度に違いがあることが指摘されている。性别、语言背景、地址是外部赋予的信息。此外,还提到了接收者的人数和特性(一般、素人、专业、专家、学生)以及发信者与接收者之间的关系(距离:远 • 近)。佐野(他)(2009)提到作为读者的书籍销售对象所赋予的 C 代码的可用性。在 C 代码中,销售对象(第一位数字)被分类为一般、教养、实用、专业、女性、学参(初中/高中)、儿童、杂志处理。销售对象类别之间文本的性质影响着词汇密度,当销售对象为儿童或一般时,词汇密度往往较低,而在“专业”的情况下,词汇密度则较高。C 代码的销售对象可以作为类似信息的可用性,但 BCCWJ 中包含的大部分样本被分类为“一般”,仅凭“销售对象”的信息无法捕捉文本之间的差异。即使在一般中,专业性和非专业性之间的词汇密度也存在差异。
また、C コードの形態(2桁目)から、形態別サンプル分類(コミック/ムッ ク • その他/絵本/事 • 辞典/新書/図鑑/全集 • 双書/単行本/文庫)に分けられている。語彙密度を分析した佐野他(2009)では、形態別分類では、全書 • 双書では情報の詰め込み度が高く、文庫では情報の詰め込み度が低い とされる。此外,根据 C 代码的形态(第二位),被分为形态别样本分类(漫画/穆克 • 其他/绘本/事 • 词典/新书/图鉴/全集 • 双书/单行本/文库)。佐野等(2009)分析了词汇密度,形态别分类中,全书 • 双书的信息密度较高,而文库的信息密度较低。
4.2. 読解と外部リソース——外部付与情報の活用4.2. 阅读理解与外部资源——外部赋予信息的利用
言語教育場面で使用される読解材料としての文章は、たいていの場合、も との文章中の一部分であることが多く、断片的であり、本来存在した使用文脈とは分離した状態にある。作为语言教育场景中使用的阅读材料,文章通常是原文中的一部分,往往是片段化的,与原本存在的使用语境分离。
書物であれば表紙やその装丁、判型、新聞であればその文章が占める位置情報(トップ記事等)とともに存在していたはずであるが、教材になる時点で は、多くの場合、これらの情報は捨象され、文章の内容部分とされるものの全部、あるいは一部分が取り出され、一次元的な文章に置換される(丸山(他) 2007)。しかし、日常の読解では、文章のジャンルや時代背景等、作品の情報が、覆い隠されることは少なく、むしろ、これらの参照情報は文献や記事书物的话,封面和装帧、判型,报纸的话,文章所占的位置(如头条新闻等)本应存在,但在成为教材的时点上,很多情况下,这些信息被抛弃,文章的内容部分的全部或部分被提取,替换为一维的文章(丸山(他)2007)。然而,在日常的阅读理解中,文章的类型和时代背景等作品信息很少被掩盖,反而这些参考信息是文献和文章。
を探したり、内容を知るための有力な手がかりとなっていると考えられる。著者名、出版社等は表紙や背表紙を見れば即座に分かるが、文章が意図さ れる結果や、想定される受け手(一般、専門家、学生)は全てが明示的に記載 されているとは限らず、書物の内容等から総合的に読み取る必要がある。甲田(2012)では、外部付与情報のらち、書物を手に取った段階で即座に分か る情報を外部リソースとして外部付与情報と区別し、日本語母語話者と外国人日本語学習者の読解に外部リソースがどのように影響していたかを考察し た。良く読める読み手は、ある書物を理解するために、同テーマの文章を読 んで比べたり、その文章の関連知識を得ようとしていたが、これは、その書物を取り巻く情報を得ることが、その書物の相対的位置づけに貢献すること を知っているからである。被认为是寻找和了解内容的重要线索。作者名、出版社等可以通过封面或书脊立即得知,但文章所意图的结果或预期的受众(一般、专家、学生)并不一定全部明确记载,需要从书籍的内容等综合解读。甲田(2012)区分了外部赋予信息和在拿起书籍时立即可知的信息,探讨了外部资源如何影响日语母语者和外国日语学习者的阅读理解。能够很好阅读的读者为了理解某本书,会阅读同主题的文章进行比较,或试图获取相关知识,因为他们知道获取围绕该书的信息有助于其相对定位。
外部リソースの検討は、教室場面での学習対象としての読解を学習対象以外の読解に位置づけることに通じる。よく読める読み手は、これまでに読ん だ経験から、ある特定のジャンルの文章パターンの知識を利用していた。ま た、複数の観点に触れ、その中での傾向や異なりを見つけることで文章の理解を深めようとしていた。これは、読んだ経験によってパターンが積み重ね られたといらことであり、読んだ経験を積み重ねるごとに、文章を相対的に位置づけることができるようになるからである。ある特定の文章は、何らか のジャンルの中での存在であり、ジャンルや分野、作者に関する情報は、比較検討のためのインデックスのような役割を果たす。外部リソースは、文章 の背景となる情報を与え、比較を容易にし、いくつかの文章の類似点、相違点を探しやすくするのに有用な情報である。外部资源的考察与将课堂场景中的阅读理解定位为学习对象以外的阅读理解有关。能够很好阅读的读者,利用以往阅读经验中的特定类型文章模式的知识。此外,通过接触多个视角,试图发现其中的趋势和差异,从而加深对文章的理解。这是因为通过阅读经验积累了模式,随着阅读经验的增加,能够相对地定位文章。某特定文章是在某种类型中的存在,关于类型、领域和作者的信息起到比较研究的索引作用。外部资源提供文章背景信息,便于比较,并有助于寻找几篇文章的相似点和差异点。
読解材料としてのテクストと実際に読むテクストとの特性の異なりは、読解対象の違いのみではない。実際の場面でテクストを読む場合には、娯楽や情報収集等、何らかの目的が存在するが、言語教育場面での読解では、読解能力の向上が目的であり、読み手が文章をどのような関わりで読むかは、抽象化される。これらの実生活での読解活動と、教育場面での読解活動の一致 の度合い(真正性、authenticity)が考慮される必要がある。作为阅读材料的文本与实际阅读文本的特性差异,不仅仅在于阅读对象的不同。在实际场景中阅读文本时,存在娱乐或信息收集等某种目的,而在语言教育场景中的阅读理解则以提高阅读能力为目的,读者与文本的关系被抽象化。需要考虑这些实际生活中的阅读活动与教育场景中的阅读活动的一致性程度(真实性)。
4.3. フィールド、テナー、モード 4.3. 领域、男高音、模式
テクストの分野によって使用される言語の特徴に違いがあることが多々指摘されている(O’Donnell 1974, Chafe 1982 等)。例えば佐野(他)(2009)で は、「現代日本語書き言葉均衡コーパス」に含まれるテクストの語曼密度に ついて Halliday らの状況コンテクストの枠組みから検討している。文本领域使用的语言特征常常存在差异(O’Donnell 1974, Chafe 1982 等)。例如,佐野(等)(2009) 研究了“现代日语书面语均衡语料库”中文本的词汇密度,并从 Halliday 等人的情境语境框架进行考察。
Halliday らは、テクストの特性を規定する要因としてフィールド(Field:活動領域;文章の分野や主題)、テナー(Tenor:役割関係;書き手と読み手 との社会的関係)、モード(Mode:伝達様式;話し言葉か書き言葉か、読み手の取り込みやすさ等)の 3 者を挙げている(Halliday and Hasan 1985,佐野 (他)2009)。Halliday 等提出了作为文本特性规定因素的三个方面:领域(Field:活动领域;文章的领域或主题)、语气(Tenor:角色关系;写作者与读者之间的社会关系)、模式(Mode:传达方式;口语或书面语,读者的接受度等)(Halliday and Hasan 1985,佐野(他)2009)。
(9)フィールド、テナー、モード (9)字段、音高、模式
フィールド (言語活動領域):テクストの分野や主題などを含む。例:Brown コーパスの創作散文の分類、BNC の分野分類领域(语言活动领域):包括文本的领域和主题等。例如:布朗语料库的创作散文分类,BNC 的领域分类
テナー(役割関係):参加者、関与者の地位や役割。男高音(角色关系):参与者、相关者的地位和角色。
話し手と聞き手、もしくは書き手と読み手の社会的関係。例:BNC Web Indexer にある読み手の対象レベル、年齢、性別、著者の年齢や性別の分類などがある。话者与听者,或者写作者与读者的社会关系。例如:BNC Web Indexer 中的读者对象水平、年龄、性别,作者的年龄或性别的分类等。
3. モード(伝達様式):テクストにおける言葉の役割のことで、テク ストの修辞的目的、聞き手や読み手がテクスト生成に参加しやすいか どうか(process sharing)、話し言葉か書き言葉かなど。例:BNC の話 し言葉と書き言葉の分類。3. 模式(传达方式):指的是在文本中语言的角色,包括文本的修辞目的、听众或读者是否容易参与文本生成(过程共享)、是口语还是书面语等。例:BNC 的口语和书面语分类。
この枠組みから佐野(他)(2009)では、Field ではジャンル(産業〜文学)、 Tenor では販売対象 (専門〜児童)、Mode では形態(全集 • 双書〜文庫)が平均値の差が大きかった、とされている。佐野(他)(2009)によると Tenor(役割関係)の要因として、話し手と聞き手の距離、習熟度や専門性の差、フォー マリティなどがあるとされる。在这个框架中,佐野(等)(2009)指出,在 Field 中,类型(产业〜文学)、Tenor 中,销售对象(专业〜儿童)、Mode 中,形式(全集 • 双书〜文库)的平均值差异很大。根据佐野(等)(2009),Tenor(角色关系)的因素包括说话者和听者的距离、熟练程度和专业性差异、正式性等。
テクストの特徴を読み手と関連づけて把握しようとする試みは、単にテク试图将文本的特征与读者相关联的努力,不仅仅是文本
ストの特徴を挙げるよりも、読み手との関係の中で位置づけようとする態度 である。ある特定のテクストがどのような読者を対象としているかは、テク ストの難易度や語彙構成や用いられる表現等、内部要素を知る上で重要な要素である。与其列举特征,不如在与读者的关系中进行定位。这种特定文本面向的读者类型,是了解文本难度、词汇构成和所用表达等内部要素的重要因素。
4.4. 硬さと軟らかさ 4.4. 硬度与软度
文体が複数のパラメータによることは古くから指摘されてきたが、コーパ スの整備 • 拡充に伴い、近年具体的指標との相関に関する研究が蓄積されて いる。文体受多个参数的影响这一点早已被指出,但随着语料库的整备和扩充,近年来关于具体指标之间相关性的研究不断积累。
国立国語研究所 BCCWJ には、あわせて約 22,000 の書籍サンプルが収録 されている。しかし、柏野(他)(2012)が述べるように、EAGLES(1996)が コーパスヘ付与することが望ましいと挙げる、(A)対象読者に想定される読解しベル(難易度)、(B)作成意図、(C)さまざまな文体情報の 3 種に関する情報は C コード以外には与えられておらず、それらの観点による文章の分類や抽出は困難である。そこで、(A)を補う「対象読者(難易)」、(B)を補う「主観的 • 客観的」、(C)を補ら「硬軟」「丁寧さ」「直接的な語り性の有無」 といら、あわせて 5 つの分類指標を新たに設計したとされる(柏野 • 奥村 2012)。「© さまざまな文体情報」とは複数のパラメータによる要因であ り、文章全体を通しての硬さや柔らかさもこれに入るとされる。柏野(他) (2012) では、早くから提案されてきた文体情報の区分、例えばJoos (1961) の提案 (“frozen”、“formal”、“informal”、“colloquial”、“intimate”) は、形式性、親踈性、口語性に関わる文体情報であるとしている。そして、形式性、親䂾性を間らものとして「硬軟」と「丁寧さ」の指標を、口語性を問らもの として「直接的な語り性の有無」といら指標を設けている。国立国語研究所 BCCWJ には、约 22,000 本书籍样本被收录。然而,如柏野(他)(2012)所述,EAGLES(1996)提出的希望附加于语料库的(A)目标读者的预期理解水平(难度)、(B)创作意图、(C)各种文体信息的三种信息,除了 C 代码外并未提供,因此根据这些观点进行文章的分类或提取是困难的。因此,补充(A)的“目标读者(难易)”、补充(B)的“主观 • 客观”、补充(C)的“硬软”“礼貌性”“直接叙述性有无”等,共设计了五个新的分类指标(柏野 • 奥村 2012)。“© 各种文体信息”是由多个参数构成的因素,文章整体的硬度或柔软度也被认为包含在内。柏野(他)(2012)指出,早期提出的文体信息分类,例如 Joos (1961) 的提案(“frozen”、“formal”、“informal”、“colloquial”、“intimate”),与形式性、亲密性、口语性相关的文体信息。因此,作为形式性、亲密性的指标设定了“硬软”和“礼貌性”,作为口语性相关的指标设定了“直接叙述性有无”。
柏野(他)(2012)で挙げられる「硬い印象」「軟らかい印象」「くだけた印象」を与える典型例における特徴のらち、語彙に関わるものとしては以下の よらなものがある。柏野(他)(2012)提到的“硬的印象”“软的印象”“随意的印象”所给出的典型例子的特征,涉及词汇的有以下几种。
(10)硬軟に関わる要素(柏野(他)(2012)から一部抜粋)(10)硬软相关的要素(柏野(他)(2012)部分摘录)
a. 硬い印象を与える特徴 给人坚硬印象的特征
接続詞 • 副詞が硬いものが多い(「すなわち、あるいは、ないし、连接词 • 副词中有很多生硬的词(“即,或者,或者,
一方で、にもかかわらず」、など) 一方,尽管如此)等)
親密度の低そうな語(学術 • 専門用語)が多い 亲密度低的词汇(学术 • 专业术语)很多
b. 軟らかい印象を与える特徴 b. 软化印象的特征
直接的に語りかけてくるような文がある(文末が「ね、よ、でしょ ら、でしょうか」)直接对话的句子(句末是“呢、哟、吧、对吧”)
接続詞 • 副詞に軟らかいものがある(「ですから」など)连接词 • 副词中有柔和的东西(例如“所以”等)
c. くだけた印象を与える特徴 c. 给予轻松印象的特点
平易な語に加え、俗語がある 平易的语言中还有俚语
音変化(拗音化、撥音化など)の語がある 音变化(拗音化、拨音化等)的词语存在
オノマトペが多い 拟声词很多
感覚や感情表現が多い 感官和情感表达丰富
これによると接続詞 • 副詞は文体によって使い分けられている。同様に文末表現の終助詞も特定の文体(軟らかい)で使われている。根据这点,连词和副词根据文体的不同而有所区分。同样,句末表达的终助词也在特定的文体(柔和的)中使用。
5. 話し言葉と書き言葉 5. 口语和书面语
語彙の選択や文体その他の言語特徴は、テクストの性質によって一定の傾向が見られる。例えば伝達媒体としての話し言葉と書き言葉の違いは、語巢 の選択に大きく関わる。話し言葉と書き言葉の言語的違いはどのような要因 によって生じるのであろらか。以下では、なぜある特定のレジスターである特定の語彙や表現が用いられるか考察する。语汇的选择、文体及其他语言特征,因文本的性质而呈现出一定的趋势。例如,作为传达媒介的口语和书面语之间的差异,与词汇的选择密切相关。口语和书面语的语言差异是由哪些因素产生的呢?以下将探讨为何在某一特定语域中使用特定的词汇和表达。
5.1. 話し言葉と書き言葉の対比 5.1. 口语与书面语的对比
Biber (1988) で述べられるように、すべての書き言葉、すべての話し言葉 に当てはまる均質的な共通性はないため、典型的な話し言葉、典型的な書き言葉といら概念によって押さえ、その特徴を探る。正如 Biber(1988)所述,由于没有适用于所有书面语言和口语的均质共性,因此通过典型的口语和典型的书面语言的概念来把握并探讨其特征。
例えば、書き言葉では、思考内容を内容の濃い、しかも結束性のある表現比操作し、整え上げる時間があるため、話し言葉ではめったに使わない表現 (從属節や情報を圧縮した漢語名詞句)を多用することが考えられる。これに対し、発話内容と形式が発話以前にあらかじめ決まったものではない場合、次のように言い淀みや繰り返し、考えながら話すという思考過程が表されて いる。次の例では、大学生の話者が男女差が生まれる原因について小学校の クラブ活動について述べている(()内の数字はポーズの秒数を表す。章末に転写記号。下線
qquad \qquad は本章での注目語彙を指す)。
例如,在书面语言中,由于有时间对思维内容进行浓缩且具有连贯性的表达比操作和整理,因此可能会多用在口语中很少使用的表达(从属节和压缩信息的汉语名词短语)。相对而言,当发话内容和形式不是在发话之前预先决定的情况下,思维过程通过犹豫、重复和边思考边说的方式表现出来。在下一个例子中,大学生的发言者正在讨论男女差异产生的原因,提到了小学的社团活动(()内的数字表示停顿的秒数。章节末尾有转录符号。下划线
qquad \qquad 指的是本章中的重点词汇)。
(11) A:え::だから(1.0)個人的には(1.5)自分の体験をふまえて(.)だから(.)体験としては (.) 小学校の(.)スポーツクラブとかが(0.5)サッカー部 とか(.)いろいろあったけど(0.4)なんか()男女とか(.)>なんかく(.) この部活は男子が入るもんで[(.)(この部活)は女子が入るもん =
(11)A:嗯::所以(1.0)就个人而言(1.5)基于自己的经历(.)所以(.)作为经历来说(.)小学的(.)体育俱乐部之类的(0.5)足球部等等(.)有很多(0.4)什么的()男女之类的(.)>什么的(.)这个社团是男生可以加入的[(.)(这个社团)是女生可以加入的
B : [あ:::: なるほどね ]
A
:=
A
:=
A:= \mathrm{A}:= ってなんかその(.)いや(.)一応
↑
↑
uarr \uparrow 入るの(.)入る中では(.)その(.) はい(.)両方入っていいんやけど:(0.5)あ:実際にはか(.)か h た よってる>といらかく. (TUCSJ
1
)
1
{:^(1)) \left.{ }^{1}\right)
ここでは、接続詞「だから」が 2 度用いられているが、接続詞の後件には論理の帰結や結論が位置していない。むしろ結論へ到着しようとする意向が「だから」によって示されている。このように論説文に典型に見られるよう な論理構成は話し言葉では必ずしも実現されない。また、「なんか」の多用 によって言葉を探しながら発話していることが伺える。並列助詞「とか」の使用も話し言葉に特徴的で、小学校のスポーツクラブにあったスポーツの種類として「サッカー部」が挙げられているが、一例であることが非網羅的(森山 1995、中俣 2008)に示されている。同じ並列の助詞でも「と」を用いる と「サッカー部とテニス部」のように、一例ではなく網羅的に把握している ことが示される。また、「なんかそのいや」の「その」のように指示詞が明確な指示対象を持たずにこれから提示する発話内容を漠然と示すことも話し这里使用了两次连词“所以”,但连词后的内容并没有逻辑的结论或结果。相反,试图到达结论的意图通过“所以”得以体现。这样的逻辑结构在论说文中典型地出现,但在口语中并不一定实现。此外,通过频繁使用“什么”的方式,可以看出说话者在寻找词汇。并列助词“等等”的使用也是口语的特点,提到的小学体育俱乐部中的运动种类中列举了“足球部”,但这被表明为一个非全面的例子(森山 1995,中俣 2008)。即使是同样的并列助词,使用“和”时,如“足球部和网球部”,则表明对运动种类的全面把握。此外,像“什么那个”的“那个”这样的指示词并没有明确的指示对象,而是模糊地指示接下来要提出的发言内容,这也是口语的特点。
言葉に特徵的である。話し言葉での、即興で思い付いた順に話すといら非訃画性、自発性が語彙に表れている。言语具有特征。在口语中,按照即兴想到的顺序进行表达,非正式性和自发性体现在词汇中。
即興で思い付いた順にといらのは推敲を経て構成される書き言葉とはかな即兴地想到的顺序和经过推敲构成的书面语言是不同的
り異なるものである。「あと」「で」などが話し言葉で多用されるのは文体に よるというだけではなく、話し言葉の特徴、すなわち非計画性と強く関係し ている。它们是不同的。像“あと”和“で”这样的词在口语中被广泛使用,不仅仅是因为文体的原因,还与口语的特点,即非计划性,密切相关。
次の例では、春の忙しい時期に本屋のバイトの内容が変わったことが語ら れている。在下一个例子中,讲述了春季繁忙时期书店兼职工作的内容发生了变化。
(12)A:あとバイトの話だと:春先っ(.)ていらのは(2.0)教科書買い取る(.) あのお客さんから(12)A:还有关于打工的事:春天的时候(.)要从那位顾客那里买教科书(.)
B:はい。 B:是的。
A:>使わなくなった教科書をく買い(.)取って(.)でそれを春の:(.) その新しい学期に向けて売り出すっていら(.)そういら(.)まあ割 と忙しい時期だったんですけど =A:>买下不再使用的教科书,然后在春天为新的学期出售,虽然那段时间相对忙碌。
B:=はい。 B:=是的。
A:それが全くなくなっhh てしまって .h (TEQCSJ)A:它完全消失了 hh (TEQCSJ)
話し言葉では、情報の単位が細切れで、節連鎖の途中に「あの」「で」「そ の」「そういら」「まあ」などの表現やポーズをはさみ、順に提示している。在口语中,信息的单位是零散的,在节链的中间插入了“那个”、“所以”、“那么”、“这样”等表达和停顿,依次呈现。
5.2. Chafeによる2つの軸 5.2. Chafe 的两个轴
Chafe(1982)は、書き言葉では思考内容を内容の濃い、しかも結束性のあ る表現に操作する時間があるため、話し言葉ではめったに使わない表現を使 らと述べている。そして書き言葉、話し言葉、口承文芸の特性を規定する要因として2つの軸を挙げている。1つは、統合と断片化 (Integration/ fragmentation dimension) であり、もら 1 つは分離と自己関与 (Detachment/ involvement dimension)の軸である。以下に、この2つの軸についてChafe (1982)の概要を述べる。Chafe(1982)指出,由于书面语言有时间将思维内容转化为内容丰富且具有连贯性的表达,因此很少使用口语中使用的表达。他提出了两个轴作为规定书面语言、口语和口头文学特性的因素。一个是整合与碎片化(Integration/ fragmentation dimension),另一个是分离与自我参与(Detachment/ involvement dimension)。以下是关于这两个轴的 Chafe(1982)的概述。