「台割り」の呪縛を乗り越える、辞書の電子化(1)~【セミナー備忘録】:『デジタル大辞泉』すべて見せます話します

(自分用の備忘録です。議事録ではありません)

JEPAセミナー:『デジタル大辞泉』すべて見せます話します

 デジタル辞書の世界で、果敢な挑戦を続けられている小学館「デジタル大辞泉」について、板倉編集長に制作から 販売までのすべてを語っていただきます。

日時: 2014年10月16日(木) 15:00-17:30(受付開始14:30)
場所: 飯田橋:研究社英語センター

主催: 日本電子出版協会(JEPA) レファレンス委員会、プラットフォーム委員会

■講師  大辞泉 板倉 俊 編集長
【プロフィール】 1959年生まれ。 1991年小学館入社。以来『大辞泉』の編集を担当。小学館出版局プロデューサー:デジタルリファレンス編集長。

■概要
●前半 「『デジタル大辞泉』の作り方」
初めにデジタル化ありき ~CD-ROM版とXML化
データベースの活用 ~編集システムの構築と活用【デモ有】
最新の言葉を辞書で引く ~新規項目の追加と既存項目のメンテナンス
未来の辞書スタイル ~カラー画像、地図、外部リンク、大辞泉プラス

●後半「『デジタル大辞泉』のビジネス展開」
時代に合わせたデジタル展開 ~アプリ開発と外部提供
書籍版『大辞泉 第二版DVD-ROM付』の特長
あなたの言葉を辞書に載せよう ~ネットキャンペーンと「笑っていいとも!」

●質疑応答

板倉さんがこのセミナーで言いたかったことは3つ。

・「デジタル」は楽しい。
・大人向けの「紙の辞書」は終わった。
・ブランディングが大事。


(面白かった、おやと思った、などの点を箇条書き)

sem019 デジタル大辞泉 2
・毎日新聞を読んで、載せるべき単語を探す。この作業はどの辞書出版社でもやっている作業。ただし、『大辞泉』に限っては、日々のデータ更新と連動している。XMLデータが日々生成、更新されている。こんな編集体制をとっている辞書は他にないのでは。
・『大辞泉』は当初からデジタル化にこだわってきた。先駆者、『広辞苑』にならってのことだったが、97年にCDROMを作った際に、「デジタルの面白さを体感」、2000年から体制、仕組みへ落とし込むことを着想、2007年には凸版との共同作業で編集支援システムを稼働させた。
・この間、ネットが広く深く社会へ浸透していった。またデバイスが急速に進化した。会社には大きな投資の意思決定をしてもらったが、体制作りは社会の潮流と同期していて、手ごたえがあった。小学館の中には他にもデジタル関係のプロジェクト、動いているデータ・システムがあるが、大辞泉のものが一番成功していると自負している。

・「デジタルの面白さ」はまずなんといっても、紙と異なり、ユーザー利便性を考慮した工夫がすぐに具体化できる点。

sem019 デジタル大辞泉 3

ひとつの例として大辞泉CDROMには、総画数カスタマイズのオプションがある。辞書引きには、五十音順、次に部首からの検索、最後が総画数からの調べとなる。しかし、総画数で探すのは、言わずもがなのものが順次出てくる上、その順序のロジックがユーザーにはよくわからない。そこで、たとえば「国がこい」の漢字は要らない、などの削除をしてあげると、探す範囲が狭くなり目当ての漢字を見つけやすい。こういうことは、デジタルの世界ではなんでもなくできてしまう。

・似た発想で、漢和辞典作りをした際は、「部首ナビ」を作った。
Web日本語 -小学館 国語辞典編集部- 例解学習漢字辞典 第六版 http://www.web-nihongo.com/wn/dictionary/dic_46/d-index.html

sem019 デジタル大辞泉 4

・このアイデアは小学館のすべての学習用辞書に応用されることになった。さらに、2001年に「ドラえもん版」を作った。
・いずれの工夫も少子化の中での他社との競争を勝ち抜く、差別化のために実行したのだが、それをただ可能にするだけでなく、迅速に具体化できたのはデジタル化体制があったればこそ。また個別のアイデアの具体化コストも、紙でやるより安くなる。

sem019 デジタル大辞泉 5
・編集システムということでは、まず「きっずジャポニカ」で手を染めてみた。
・背景に2002年の「ポプラディア」登場、また同じころ始まった「Yahoo!きっず」がある。ポイントは、カラー、ビジュアル、音声。

調べ学習に役だつ百科事典サイト|ポプラディアネット https://poplardia.net/

Yahoo!きっず http://kids.yahoo.co.jp/

・またもちろん、ジャパンナレッジとの連携もあった。
ジャパンナレッジ Lib http://japanknowledge.com/library/

・ちなみに現在小学館の中には、国語辞書、外国語辞書、ニッポニカ事典、日国、もうひとつ開発中のもの、合計5つのデータベースが走っている。

改めて、紙との違い、デジタル化のメリットをかかげると次の4点。そしてこの4点こそが、他社差別化の起点となるもの。さらには新しいビジネスを産む貯蔵庫にも。そう認識して体制整備に努めてきた。

sem019 デジタル大辞泉 6

・直接ユーザーが目にしないところにもさまざまな工夫がある。たとえば、検索の際の「表記の揺れ」も「隠し検索キワード」として入力する管理画面となっている。

sem019 デジタル大辞泉 7

sem019 デジタル大辞泉 8
・「意識障害」を例にとると、管理画面からの入力でこのようなXMLデータが生成され、ユーザーの検索活動が快適なものとなり、良質な「ユーザーエクスペリエンス」を演出している。

(しばらく管理画面のデモ)
・修正履歴が残る。
・リンクが簡単に張れる仕組み。
・ある見出し項目の年表がすぐ作れる。
・棒ゲラ表示も可能。
・文字はJIS第二水準まで。外字も登録。

・このことも含め、大辞泉XMLデータの特徴を整理すると下記のようになる。
・14桁IDとは、冒頭述べた日次でのデータ更新と関係した措置。最初の6桁が見出し項目の配列番号、次の6桁ないし8桁が見出し項目のユニークID。つまり、日々新しい見出し語が拾われていく、すると、本にする、正式データとしてリリースする際の順番はどんどん後ろへ下がっていく。そこでこの二つを区別、管理できるコード体系を作った。

sem019 デジタル大辞泉 9

・『大辞泉』は1995年刊行の初版時点で、カラー版縦書き3000ページくらいの辞書。その後、2012年の第二版で横書きに変更。
・見出し項目の16%は見出しがアルファベット表記。一方で、縦書きでないと表現しずらいのは5か所くらい、漢文などの返り点や、踊り字(「々」など)など。となると、横書きの方が便利だということで第二版は「横」にした。
●今、日本語の「読み」「書き」は横組みがトレンド!実はかなり読みやすい「横組み」国語辞典 http://news.livedoor.com/article/detail/7229202/

・第二版のときで、書籍の見出し項目数は25万語くらい、DVDの方が書籍より締め切りを遅くできたため、5000語くらい語数が多くなった。その数か月の間に新たな言葉が次々に生まれてきたためだ。
・日々XMLデータを更新するが、公開ベースでいうと、年に三回締め、編集作業を行う。一回2400語くらいが追加される。追加項目だけでなく、既存の項目も1万から1万5000語の修正がかかる。
・見出し項目の増殖の様子を表にすると下記の通り。2008年(ここでは年三回のうち、8月基準で表示)228千語であったものが、今年2014年には273千語になった。

sem019 デジタル大辞泉 11

・さらに重要なのが、テキスト以外のデータ群。類語、画像と加えていき、直近では画像が12千点、ビデオ、これはNHKのものが多いが180点。地図は12千点ある。

・このように一見野放図な増殖は紙ではありえない話。デジタルならでは。紙の「台割り」の呪縛から離れられるところに、電子化の意義、デジタルによるビジネスチャンス創出の鍵がある。

(ここで当日も休憩にはいったので、こちらもひとまず)
→次のページ (2) https://societyzero.wordpress.com/2014/10/23/00-107/

修正:2014年10月23日

広告

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中