会話の200ミリ秒——人はなぜ沈黙を嫌うか
要点
- 人どうしの会話では、話者交替の間隔がおよそ200ミリ秒前後に収まるとされる。
- この短さは多くの言語に共通して観察され、沈黙の長さには文化差もある。
- 機械との対話でも、応答の「間」が自然さの印象を左右する。
会話を録音して波形を眺めると、奇妙なことに気づく。一方が話し終えてから他方が話し始めるまでの隙間が、驚くほど短いのだ。多くの場合、その間隔はコンマ数秒に過ぎない。わたしたちは相手の発話が終わるのを聞いてから返答を組み立てているはずなのに、なぜこれほど素早く切り替えられるのか。
この問いに取り組んだのが、言語学者タニア・スティヴァースらが2009年に米国科学アカデミー紀要(PNAS)で発表した研究「Universals and cultural variation in turn-taking in conversation」である。研究チームは、世界の異なる言語圏で交わされる自然な会話を分析し、質問への応答が始まるまでの間隔を計測した。報告によれば、話者交替の間隔の中心は、おおむね200ミリ秒前後という非常に短い値に収まっていた。
聞き終える前に組み立てている
200ミリ秒という数字が興味深いのは、これが人間の発話の準備に必要な時間より短いとされる点である。返答を一から組み立てるには、もっと長い時間がかかる。にもかかわらずこれほど素早く応じられるのは、聞き手が相手の発話を最後まで待たず、終わりを予測しながら自分の返答を準備しているからだと考えられている。会話とは、交互に話す営みであると同時に、相手の終わりを読み合う営みでもあるわけだ。
スティヴァースらの研究はもう一つ重要な点を示した。話者交替の基本構造は言語を超えて共通している一方で、許容される沈黙の長さには文化による違いが見られた。応答までの「間」をどの程度自然と感じるかは、普遍的な土台の上に、文化的な変奏が乗っている。
沈黙が語るもの
会話における短い沈黙は、単なる空白ではない。応答が0.2秒で返るか、1秒の間が空くかで、その返答が帯びる意味は変わる。「行ける?」という問いに即座に「うん」と返るのと、一拍置いてから「うん」と返るのとでは、後者には迷いやためらいが滲む。間そのものが情報を運ぶのだ。
この感覚は、機械との対話を設計するうえで無視できない。チャットボットや音声アシスタントが、人間の会話のリズムからかけ離れた間で応答すると、わたしたちは違和感を覚える。速すぎれば聞いていない印象を、遅すぎれば反応が鈍い印象を与える。操作への即時反応が触感の問題だったのに対し、対話の間は社会的な期待の問題である。
リズムを設計するということ
もっとも、人間の会話のリズムをそのまま機械に移植すればよい、という単純な話ではない。機械が0.2秒で完璧な長文を返すと、かえって不自然に感じられることがある。人間ならその速さでそれだけの内容は返せない、という暗黙の期待が裏切られるからだ。ここには速すぎる応答への不信と通じる構造がある。
会話の200ミリ秒という発見は、対話の自然さが速さだけでは測れないことを教えてくれる。重要なのは、応答の間が、その場のやり取りにふさわしい長さに収まっているかどうかだ。沈黙は埋めるべき欠陥ではなく、リズムを構成する要素である。機械との対話に「入力中」の表示が広まった背景にも、この間の問題が関わっている。その演出が何を変えたのかは、「入力中…」の演出で考えたい。
主な参照
- Tanya Stivers et al., “Universals and cultural variation in turn-taking in conversation,” PNAS, 2009.
- Stephen C. Levinson, “Turn-taking in Human Communication” 関連研究.