けものみち

まったりと、きのむくままに。

情報検索のためのユーザインタフェース Ch.1

情報検索のためのユーザインタフェースという本を、修論の研究のために借りてきたのでダイジェストで軽くまとめてみます。すっ飛ばしている箇所が多いが要点はまとめたつもりです。


1.1 インタフェースをシンプルに保つこと

今日(2007~2011?)に見られる典型的な検索インタフェースは、フォームにキーワードを入力し、その結果をリストで表示するというシンプルな方式である。なぜ、ここまでシンプルであるか。

  • 検索は単なる手段なので、思考の流れを妨げるインタフェースは好まれない
  • 文書を読むときに、気を散らすようなものが少ないインタフェースの方が好まれるし便利
  • 年齢、文化、経歴の違いを問わず、幅広いユーザにとってつかいやすい方がよい
  • 多様な情報要求に対して利用しやすいほうがよい

高齢者にとっては、検索結果をさらにシンプルな表示にすると、エラーが減ることが実験でわかった。

また、一部のユーザーは基本的なキーワードの指定すら理解できていない。このことはクエリ指定が難しいということも示している。

クエリの入力ミスやありがちな例

  • アドレスバーの構文と検索構文を理解できていない(URL の途中にスペースを入れる、あるいはクエリで単語区切りでスペースを入れない)
  • AND 条件と OR 条件、Indexing についてなど知識がない
  • 検索エンジンを使い始めたばかりの人は、キーワードではなく自然言語をそのまま入力してしまいがち

検索にあたっては、検索結果のリストのWebサイトをみて、中身を確認しながら自分の欲しい情報にマッチするかどうかを確認するのが正しいが、最初に検索したときに求めていたものがなければ検索できない、あるいはそもそも情報がないとあきらめてしまう人もいる。

シンプルなインタフェースですら、このように一部のユーザには利用が難しいと考えられている。 一方で、インタフェースの改良で成功した事例もある。

本章では、どのようにしてインタフェースが進化してきたかの過程についてみていく。


1.2 検索インタフェースデザインの歴史的変遷

Web が普及する以前は、高度な教育を受けた人々が利用するものであった(法律家補助員、図書館員、ジャーナリストetc...)。 これらの人々は、専門的、高品質、情報指向なテキスト集合を対象として検索を行っていた。また、この検索では、フルテキストを対象として検索はできず、タイトルを検索して、紙媒体で本を取得するといった手間があった。

一方、現在では、そのようなテキスト集合よりもはるかに幅広いコンテンツを扱っている。例えば、パンフレット、広報情報、企業や各種団体の情報、趣味の情報、雑学などである。

旧来の検索クエリは「Boolean 構文」によるクエリ指定で、特徴的なコマンドであった。 また、検索回数や利用時間に応じて利用料が課せられるシステムであった。 このようにそもそも検索システムを使う障壁があることが、新しいユーザインタフェースの採用を遅らせる原因の一つとなったと考えられる。

まとめると、

  • ユーザが高度に習熟された人々だけではなく、一般の人を対象としたものに変化していった
  • 論文などのような専門的なものの検索に限らず、多種多様なタイプのコンテンツへの検索への対応
  • タイトルやアブストラクトだけではなく、コンテンツの中身そのものをフルテキストで検索できるようにする

あたりが Web が普及する前後でのインタフェースの違いを説明するのに役立つと考えられる。 (加えて、コマンドラインから、グラフィカルなディスプレイに表示するというのに変わったという点も書籍内では説明されている。)


1.3 検索インタフェースデザインのプロセス

ユーザビリティの5つの要素(Shneiderman, Plaisant)

1. 学習しやすさ(Learnability)

そのインタフェースを初めて使う時に、どの程度簡単にタスクを遂行できるか

2. 効率(Efficiency)

インタフェースについて十分理解した後、タスクをどれだけ素早く達成できるか

3. 記憶しやすさ(Memorability)

期間をあけて久しぶりに使う時に、再度使いこなせるようになるまでどの程度時間かかるか

4. エラー(Errors)

エラーの程度、深刻さ、正しい状態に戻るためにはどの程度かかるか

5. 満足度(Satisfaction)

インタフェースを利用することでどの程度満足感が得られるか

これらを達成するためにインタフェースはどのようにデザインされるのか。 ユーザインタフェースの重要性は認識されるようになったが、デザインを実際にやってみるとこれらを達成するのは難しいことがわかる。

ユーザ中心設計

システムに対するユーザの反応に基づいて決定が行われる。手順は以下の通りになる。

まず、ユーザのニーズを把握する。ユーザは誰であり、目的は何か、目的を達成するためのタスクは何かというのをデザイナが調査する。

次にタスク分析を行う。どのような段階を踏んでタスクを達成するのかを明確にし、システムはどのようなタスクを支援するのかを決定する。

そして、ユーザが実際にタスクを行う時の典型的なシナリオを考える。

対象となるユーザの目的とタスクが確定後、「デザイン」「評価」「再デザイン」というサイクルでデザインを進めていき、プロトタイプを作成後、潜在的なユーザからのフィードバックをみて改善を行う。これらを十分満足できるレベルに達するまで繰り返す。少数の被験者によるテストは「ディスカウントユーザビリティテスト」と呼ばれている。

インタフェースデザインは科学的な手法より、実践的な手法が多く、このように実験を行うことはインタフェースの設計を行う上で避けられないが、よい問題解決手法というものはいくつも提案されている。そうしてデザインの反復プロセスの間で局所的な最適解を発見することがデザイナーのタスクである。


1.4 検索インタフェースのデザインガイドライン

ユーザインタフェースのデザインを成功させるためのガイドラインのうち、検索インタフェースに広く適用できる8つの重要な点を以下に列挙する。

  1. 有益なフィードバックを提供する
  2. ユーザ自身による制御を支援する
  3. 短期記憶の負荷を減少
  4. 上級者へのショートカット(使い慣れた人向けのショートカット)
  5. エラーを減らし、エラー処理を簡単にする
  6. 一貫性を追求する
  7. 作業のやり直しをしやすくする
  8. 段階的な達成感を与える

ガイドラインはデザインにおける良きアドバイスではあるが、具体性のあるものではない。また、ほかのガイドラインと対立することもあるし、ガイドラインを集めても完全なものにはならない。 しかし、これらのガイドラインは、研究や認知論、インタフェースデザインの経験論によって裏付けられているものである。これらのガイドラインの背後にある本質については以降解説する。

1.5 効率的で有益なフィードバックの提供

インタフェースデザインの鉄則として、システムの状態についてのフィードバックをユーザに提供するとともに、ユーザのインタラクションが、システム状態にどれほど関連しているかについてのフィードバックを与えることである。

例えば、GUIにおいて、何か操作をしたときに砂時計のアイコンが表示されるときは、システム内部がビジーなため、ユーザに「しばらく待つこと」を知らせる。

検索インタフェースにおける重要なフィードバックについて以下で述べる。

1.5.1 検索結果の即時表示

クエリを入力したりリンクをたどった後に、すぐに何らかの検索結果が表示できることが重要である。 特に、最低限基本的な検索結果はすぐに表示されなければならない。すぐに検索結果を表示することによって、ユーザが自分の検索に間違いがないかどうかを判断したり、検索ワードを変えて再度検索するときの代替キーワードを提案しやすくなる。

1.5.2 有用な文書サロゲートを見せるー検索キーワードのハイライト

f:id:WhiteFox-Lugh:20200613172651p:plain

ユーザの検索と、検索結果が関連していることを示すために、文書サロゲートにはユーザの検索キーワードが含まれている必要がある。以前は、検索したページの前方にある数行を示していたが、最近は、ページのどこに検索キーワードが含まれているかを Summary で見せるようにしている。

また検索キーワード周辺の情報も重要である。ヒットしたページのタイトルに検索キーワードが含まれているときは Summary に検索キーワードが含まれる必要はなく、それ以外の情報が欲しいということが研究で分かっている。

他にも、検索キーワードをハイライトして表示することも重要であり、ハイライトすることで場所がわかりやすくなり、検索結果のどこが検索キーワードに関連したかがわかりやすくなる。 しかし、ハイライトする箇所を増やしすぎるとわかりやすさが落ちるので増やしすぎないこと。 上の画像は、「クソデカ羅生門」と入力した場合のハイライト表示で「クソデカ羅生門」が太字で表示されているのがわかる。

情報量が多く、有用な Summary を見せることと、検索結果ごとの表示のスペースを抑えることはトレードオフの関係にある。 Aula の研究、 Rose らの研究では文章をどの程度切り詰めるとよいか、どの程度切り詰めすぎると逆効果になるかを検討している。

1.5.3 要求に応じた様々なソート方法

f:id:WhiteFox-Lugh:20200613173108p:plain

情報の鮮度や関連性、著者などによる検索結果のソートも効果的なフィードバックである。 商品検索やメール検索などで良く用いられている。画像はウイスキーAmazonで検索し、価格の高い順番に並べたものである。とてもじゃないけど買えない。

1.5.4 検索キーワード提案

f:id:WhiteFox-Lugh:20200613173608p:plain

f:id:WhiteFox-Lugh:20200613173658p:plain

検索キーワードを入力後、自動的に検索キーワードの提案やクエリ修正、スペルミスの修正、フレーズ語句の拡張といったフィードバックを行う仕組みがある。 ある研究では、検索回数のうち、8.4%がクエリ修正や提案から生み出されているということがわかっている。

検索補助ツールとしてスライドトレーというものもある。これはユーザが入力を行うのをやめると、検索ワード提案が行われる(例えば「京都」とクエリで打って停止すると、「京都 観光」や「京都 天気」と表示されるようなもの)。 ログ解析によると、このスライドトレーによる検索補助は30%程度のユーザに頻繁に使われたという分析がある。

1.5.5 関連性表示を慎重に使う

かつて検索エンジンでは、関連性の指標として、数値や星の数を表示していたが、そのような数値や星の数の意味するところがユーザにとってはわかりにくく、検索エンジンにおいて現在では主流ではなくなってきている。むしろ、検索結果をランキング順に縦一列で表示するのが関連性を示す仕組みとして影響力がある。

1.5.6 素早いレスポンスをサポートする

素早いレスポンスは、ユーザに流れるような作業をもたらすし、複数の検索キーワードを入力するようになる。不正確なワードや間違ったワードをためらわず入力できるようになる。レスポンスがよいほど、試行錯誤の回数が多くなり結果としてゴールに早くたどり着くようになってくる。反対にレスポンスが遅いとそもそも検索の仕方も変わってくる。レスポンスが遅いと、正確にキーワードを入力するように努力が求められる。

フライト検索などでは、検索待ち時間が発生するがこれについては過剰な不利益は感じない。そして、検索要求を処理している間はグラフィカルなアニメーション表示でユーザのいら立ちを抑えようとする努力も見られる。

1.6 自動的なアクションとユーザ自身によるコントロールのバランス

Greene らは「ユーザはわかりやすく、予測しやすく、かつ扱いやすい環境を好むものだ」と述べていて、これは一般的には優れたデザインガイドラインと言えそうだ。 しかし、システムがユーザを制御することと、ユーザがシステムの動作を細部まで制御することの間にはトレードオフみたいな関係がある。例えば、デジタルカメラではフォーカスやフラッシュ、シャッタースピードを気にしなくても勝手にやってくれることが多い。情報検索でも、ユーザの要求を見通して、優れた検索結果を返すことと、ユーザにシステム操作を委ねる処理との間に微妙なバランスがある。

1.6.1 Web 検索における表示順序

検索結果の並び順は何を表しているか? そもそも、大部分のユーザは検索技術がどのようなものから成り立っているかを理解しておらず、検索結果の並び順の背後にあるメカニズムについては特に謎になっている。

初期の検索ランキングは統計的なベクトル空間によるランキング(本には書いていないけどおそらく TF-IDF とか)が採用されていた。この方法は(Boolean モデルと比較して?)多くの検索結果を得られるが、滅多に使われないワード(IDF 値が高いワード)の方が、頻繁に使われる語句(TF 値が高いワード)よりもランクが高いのでランキングとしてはわかりにくい。

1990年代後半は、Hotbot が AND条件を用いて連言的キーワード解析によるランキングを導入し、それまでの方式よりわかりやすく改善された。

その後、Google がキーワードが近接して共起するページには高いウェイトをつけることで正確性をあげた。また、「人気度」に関わる指標である PageRank を作り上げ、ポピュラーなページが上位に来るようにランキングをした。このようなポピュラーなページが検索結果に現れやすいという仕組みは、アルゴリズム自体を理解できない素人ユーザにとってはブラックボックスのようなものである。

最もわかりやすい検索結果の見せ方は、情報の鮮度であると考えられている。Dumais らの研究によると、自分自身に関わる情報を探しているときは、ユーザはランキングより時系列を好むとのことである。しかし、Web 検索の場合は新鮮さは優先度が低く、関連度に基づくランキングの方が求められる。

1.6.2 検索ワードの変換

検索結果をより良いものにするため、巧妙に検索キーワードを変化させるものがある。 たとえば、「vs.」は自動的に「versus」に変換するといったようである。また、Google では、 ミドルネームを落として人名を含む検索結果を表示することがある。ユーザの意図にかなっている場合もあるが、後者の場合、似た名前の人を避けて検索したい場合には余計なお世話となっており、ユーザのコントロールは失われている。

ユーザからわかりにくい古典的な例としては、ストップワードの除去である。ストップワードとはありふれたワードのことであり、英語で言う前置詞 in、on や冠詞 a、an、the などがあたる。1996年の調査では、8つの検索エンジンについて「to be or not to be」の検索結果がゼロになった検索エンジンが多く、唯一 AltaVista だけがハムレットの言葉を引き当てられたという。もちろん現在ではこのような単純な問題は解決されている。

形態素解析(語幹解釈)というのも情報検索において使われてきた。簡単なワードにおいて形態素解析が行われるのをユーザが期待している反面、検索キーワードの意味を変えてしまうほど行われてしまうと逆効果である。

キーワードのスペルを自動提案にするときも、強制ではなく代替案を選ぶことができるように選択肢をもたせるのが大事である。システムの提案が常にユーザの意図に適うとは限らないからである。

1.7 短期記憶に対する負荷の減少

1.7.1 検索キーワードの入力欄での提案

f:id:WhiteFox-Lugh:20200613192612p:plain

グレーアウトして検索欄に何かしらのワードを入れておくという手法である。ユーザが入力欄をクリックするとこのフォントは消えるようになっている。 例えば、上の画像は Mozilla Firefox で新しいタブを開いた時の画面で、中央の検索ボックスに「ウェブを検索」と文字が入っている。これにより、Web 全体で検索されることがわかる。複数の検索ボックスが Web ページに置かれている時に、「サイト内を検索」するのか「ウェブ全体を検索する」のかを区別することがある。

ラジオボタンやプルダウンメニューによる操作は検索結果が表示された後の方が気づかれやすく、実際、検索結果に表示される、日付や値段によるソートは(おそらく検索結果表示後に、という意味で)意外と使われている。

1.7.2 シンプルな履歴による支援

これまでの研究により、ユーザは過去に見た情報に再びアクセスすることや、過去に検索したキーワードで再度検索することがわかっている。関連した調査で、Web 上での問題点の1つとして、 過去に訪れたページを再訪できない、というのが挙げられている。つまり、最近見た情報の検索が実はユーザの生産性を上げている。

役立つ機能としては、検索エンジンにおいては、ユーザの同意を得て検索履歴を提供していることがある。また、ブラウザ内にも最近訪れたページを見られるようにしている。

1.7.3 ナビゲーションと検索の統合

f:id:WhiteFox-Lugh:20200613195817p:plain

Web ページのリンク構造や本の目次のように、情報の構造がわかりやすいものがあるとユーザはたどりやすい。情報検索でも、検索後はナビゲーションに容易に接することができるほうがよい。

例えば、検索インタフェースにおけるカテゴリによって、情報を絞り込む際の選択肢を示す。リスト表示や階層表示がある。ショッピングサイトや製品情報、レストランガイド、図書館の目録に使われる、検索サービス側があらかじめ用意した検索条件に従って検索を絞り込んでいくファセット機能も有効である。上の画像では、ウイスキーを内容量、ブランドなどで絞れるようになっている。

1.8 ショートカットの提供

コピーは Ctrl+C(Mac なら Command + Cとか)、ペーストは Ctrl+V というように、よく使う操作にショートカットキーが割り当てられるように、検索インタフェースでもふさわしいショートカットがあるとよい。

f:id:WhiteFox-Lugh:20200613200326p:plain

サイトリンクやディープリンクとは、検索結果で最上位に表示されるサイトの下に、そのサイト内の重要なページ、閲覧回数が多いページをぶら下げて表示する機能のことである。上の画像を見ると、ちょうどこの記事を書いたときは COVID-19 の関心が高いからか、総務省と検索すると給付金や感染症対策についてのページがぶらさがっていることがわかる。

他にも過去の検索動向に基づいて、ユーザのニーズに関連しそうな答えを直接検索結果に表示することも行われている。

1.9 エラーを減らす

1.9.1 可能な限り検索結果を返す

基本的に検索結果が1件もヒットしない、ということは避けるようにしている。スペル修正やクエリ拡張はこれらの対策となる。ファセット方式では、検索結果が返らない時には、ユーザが検索条件を緩めるなどの必要が出てくる。

1.9.2 入力可能な語彙の問題

同じ事柄が多様な種類で表現されることがある。例えば、教科書の例で言えば、カメラの値段を尋ねるときは、

  • How much does that camera cost?
  • How much for that camera?
  • What are these cameras going for?
  • Please price that camera for me.

などたくさんある。 同じ概念を異なる言葉で表現しているという事実は、自分が探し求めているページの作者と、同じ言葉を使って検索するとは限らないことを意味している。これに対して、クエリ拡張は有効な手法である。また、インタフェースの各要素のネーミングについても用語の選択を慎重に行わなければならない。カードソーティングという手法もユーザのニーズを調査するのに有効である。

1.10 細部の重要性を理解する

検索インタフェースの細部が、ユーザの検索の成否に大きく関わる事例が多々ある。

広い検索フォームには、長い質問文が書かれることが実験で示されている。 Allen の研究(1994)では、検索結果の表示順の変更が、ユーザが検索対象についての情報を得る量に劇的な影響を与えることを示している。

Russell らの研究では、2次元空間で、アイコンを使って検索結果を可視化することが、必ずしも人間の知覚能力に一致せず、かえって検索効率が落ちることを示した。

また、数々の研究で、Web 検索のユーザは、最初の数件に関連する情報が表示されることを期待しており、検索結果の最初の1、2件だけを表示しがちなことがわかっている。

1.11 デザインにおける重要な美学

レイアウトの選択、余白、色づかい、コントラスト、フォント、サイズなどの様々なバランス要素をとることも大事であり、複数の展示デザインを用いて比較する研究もある。 また、最悪のレイアウトは最良のレイアウトの倍も作業時間をとること、よく練られたデザインは、検索に要する時間も短く、ユーザの評価も高いことがわかっている。

美的な印象は、サイト全体の印象、ユーザの満足感、インタフェースの質に大きく関わっている。 デザインにアピール力があれば、ユーザは Web サイトでの検索に意外に辛抱強いという報告もある(Lobb)。

Hotchkiss が行った比較研究では、普段使っている Yahoo! や MSN より Google のほうがより豊かなユーザエクスペリエンスを感じていたという。この理由を Hotchkiss は、検索結果の品質ではなく、デザインに求めている。Google のデザイナは実際に、アイコンの縦横比やテキスト広告のデザインなどの繊細な印象に細心の注意を払っているとインタビューで明らかにしている。


まとめ

ガイドラインをいくつか紹介し、少し掘り下げて紹介をしていた。この本は、2011年出版のため、執筆当時で普及しているデザイン例が多く挙げられていたが、2020年現在も原則については変わっていないように思う。美しいデザインやユーザビリティの高いインタフェースについて、何が良いインタフェースなのかを今後しっかり本書を読んで学んでいきたい。