スポンサーサイト

  • 2012.12.22 Saturday

一定期間更新がないため広告を表示しています

  • 0
    • -
    • -
    • -
    • -

    文学とデータ

    • 2012.05.29 Tuesday
    • 20:55
     

    文学とデータ

    Seibun Satow

    May. 28. 2012

     

    In the same way that past federal investments in information-technology R&D led to dramatic advances in supercomputing and the creation of the Internet, the initiative we are launching today promises to transform our ability to use big data for scientific discovery, environmental and biomedical research, education, and national security”.

    John Holdren,

     

     一人殺されただけでも大変な問題で、数字に還元できない。しかし、人間を数字に還元しなければ政治の話が出来ない。私はその違和感がある。(略)科学といい、統計という発想の中には、個人を消去して特定のカテゴリーの中の番号に還元してしまうものの考え方が内在している。それは残酷です。私はそこにこだわるのです。

     

     加藤周一は『20世紀の自画像』においてこう述べている。具体性・個別性への志向が文学のあるべき姿だとしばしば文学者から主張される。世界を外部あるいは境界から把握する叙事詩的認識が後退し、内部より見る抒情詩的視線が近代の文学の傾向である。けれども、真の主役は社会である。ある具体的な個別対象を扱いながら。社会の一側面を浮き彫りにする。思考過程をトップダウンではなく、ボトムアップにしただけで、社会を取り扱うことには変わりはない。

     

     一般性・抽象性を理解していなければ、個別性・具体性を描くことは困難である。統計はある目的に基づいて収集される。しかし、その結果はたんなる数字の分類ではない。分析し、意味を読み取る必要がある。

     

     加藤周一は殺人を比喩にしている。その意見を読む限り、彼が日本の殺人の傾向を承知していない。日本における主な殺人は心中である。加害者と被害者が顔見知りで、犯行現場が生活の場ということも少なくない。特に、近年、介護疲れが原因と推測できる事件が見られる。殺人の統計データを丹念に読み解くなら、そこから抽出できるストーリーがある。個々の事件にはそれぞれのコンテクストがある。ある事件を個別性から見るか、一般性から捉えるかが重要ではない。そのコンテクスト読み取れるかどうかがその事件についての真の理解にほかならない。

     

     人々は実感を覚えて生きている。しかし、それが社会の実態を反映しているとは限らない。収集したデータを分析すると、実感と実態がずれていることも少なくない。実感に没入し、なぜそうした乖離が生じているのかまで問う文学作品は多くない。

     

     最近、具体性・個別性の取り込み、すなわちコンテクストへの目配りは、人文・社会・自然科学のいずれの分野でも常識的に見られる。加藤周一の出自でもある医学を例にしよう。

     

     医学では、証拠に基づいた医療、すなわち「EBMEvidence-Based Medicine)」の他に、90年代から語りを基盤とした医療、すなわち「NBM(Narrative-Based Medicine)」の重要性も認知されてきている。患者の語る病の体験の物語をそのまま拝聴・尊重する。医療従事者は、病に対する解釈・対処を患者の人生というコンテクストの中で展開される物語として把握し、その語り手を尊重する姿勢をとる必要である。この物語は複雑に織り成され、多様で、絶対的なものはない。患者と医師とのこうした対話も治療の重要な一部である。

     

     こう考えてくると、むしろ、文学は、数字に還元できない固有な事象を扱うと言いながら、自分の意識の優越さのためにそれを選んできたのではないかと疑問がわく。先に言及した介護疲れの心中のような典型的な殺人事件に寄り添う文学作品にお目にかかることは稀である。個別性・具体性への志向は科学の影響力の伸長に対するアイロニーにすぎず、自身のすべきことを吟味しない怠惰の言い訳にすぎない。

     

     今日、流通するデータが増加し、それらが社会を構成する重要な要素の一つになっている。政府も企業も法人もデータ・ベースを持っている。社会性を考慮するなら、デジタルデータと文学も向き合わざるを得ない。データを丹念に読み解き、そこから抽出できる過去・現在・未来の社会のある姿を具体的・個別的なストーリーに紡ぎ出す。それが今の文学のすべきことの一つである。そのために必要なのはコンテクストの多様性を読み取ることであって、統計上非常に稀なケースを無視することではない。

     

     『ネイチャー』誌は089月号で、特集「ビッグデータ ペタバイト時代の科学(Big data: Welcome to the petacentre)」を組んでいる。ペタはテラの1000倍のデータ単位である。もはや「ペタバイト」の時代が到来しているというわけだ。「ビッグデータ」は構造化されていない大容量のデジタルデータを効率的に解析し、各種の実用的な情報を導き出すトレンドの総称である。カーナビを通じた交通情報やポイント・カードによる消費者情報、塩基配列解析から得た遺伝子情報、粒子加速器の実験結果など多岐に亘る。

     

     ビッグデータはたんに量が巨大なだけではない。リアルタイムで収集・解析される速度、さまざまな種類のコンテクストを持つ多様性という特徴がある。

     

     政府を始め各種の機関が広範囲に及ぶ膨大な量のデータを毎日のようにネット上で公開している。米国のIT調査会社IDCは、116月、この年の世界の年間総データ量を1.8ZB(ゼタバイト)と予測している。これは4.7GBの標準的DVDにして約3800億枚に相当する。IDC1237日の発表によると、世界のビッグデータ市場は2010年の32億ドルから15年には169億ドルに成長すると見込まれる。また、同じく調査会社のガートナー(Gartner)は、116月のレポートで、ビッグデータが毎年少なくとも59%ずつ増加し続けるだろうと予想している。まさにデータ爆発である。

     

     ホワイトハウスは、12329日、総額2億ドル以上の「ビッグデータ研究開発イニシアティブ(Big Data Research and Development Initiative)」の概要を発表している。このイニシアティブでは、米国科学技術政策局(OSTP)、国防総省、国立衛生研究所(NIH)、国立科学財団(NSF)、エネルギー省、米国地質調査所(USGS)の6つの政府機関が主導し、巨大なデジタルデータの組織化や知識抽出等を行うための技術やツールの開発を担当するとされている。あわせて、議会図書館(LC)や国立公文書館(NARA)、国立医学図書館(NLM)によるプログラムにも活用される。

     

     とは言うものの、専門家でなければ、意味を読み取れないものも少なくない。けれども、データのチェックも新たな集合知、すなわち「クラウドソーシング(Crowdsourcing)」を用いて効率よく行うことができるようになっている。これは、不特定多数の人に業務を委託する手法である。自分でできなくても、公益性が高ければ、サイバー空間にいる専門家のサポートをお願いすればよい。

     

     専門的なデータであっても、ITの進化に伴い、直観的な理解が可能になっている。パソコンの処理能力が向上し、高性能のソフトウェアが登場、クラウドコンピューティングが進展したため、大量のデータを容易に可視化できる。このPBの大規模データを処理するために、「ハドゥープ(Apache Hadoop)」が考案されている。これは大量のパソコンをつないで分散処理をするJavaソフトウェア・フレームワークであり、フリーで配布されている。

     

     一般ユーザーでも、今ではデータを取り扱うことが簡単になっている。グーグルが提供する無料サービスだけで地理的にデータを見やすくすることができる。入手したデータを「Googleドキュメント」内の各種サービスで整理し、それをデータ・ベース・ソフト「Fusion Tables」を使って「Google Map」上で展開する。これにより生のデータだけではわからなかったインヴィジブル・マップがヴィジュアル化される。

     

     正直、地方・中央政府の予算もこうした可視化が実施されていてもおかしくない。ニセコなど一部の例外を除くと、財政学の専門家でもなければ意味が読み取れない。また、複雑怪奇なことで知られる国の特別会計は財務省の担当者くらいしかわからないとされている。政府の予算は共有情報であるにもかかわらず、それが有権者と分かち合えない。けれども、ソフトを用いて、これを直観的に理解できるようにすれば、市民の政治参加も促進される。

     

     哲学や文学も、1980年代に、高度消費社会を根拠にシミュレーションの時代が到来し、データ・ベースの重要性が増すだろうと予言している。ある現象にまつわる諸要素の数値を少しずつ変えて入力してコンピュータに計算処理させ、蓋然的な見込みの結果を直観的に理解可能なプレゼンテーションとして見せる。こうしたシミュレーションは真理ではなく、相対的なデータであって、その実用化は政治と経済、科学の間の駆け引きにすぎない。哲学や文学によるシミュレーション科学への批判を要約すればそうなる。

     

     蓄積されたデータ・ベースを利活用してリアルタイムの動向を表示したり、過去を再現したり、未来を予測したりする。こういう可視化がシミュレーションであり、データ・ベースはこのヴィジュアル化されて初めて人々の間で共有される。従来は扱うことにおできなかった大量のデータから今の物語を紡ぎ出す。現代社会はデータによって構成されている。それを無視することはできない。蓄積されたデータに基づくシミュレーションを通じて過去は未来を左右し、未来は現在を規定し、リアルタイムの動向が過去と未来に影響を与える。利活用の履歴に応じて、実用的にデータ・ベースは改変される。データを可視化して利活用することで、新たな文学を展開できる。

     

     これほど社会に浸透しているにもかかわらず、情報の世界と格闘する文学は、あまり見受けられない。最も素朴なデータ社会についての文学的対処はそれを小道具として作品に登場させるか、懸念を描くかのいずれかであろう。それは想像力の貧困さの現われでしかない。多くの企業は個人レベルでのビッグデータの収集・分析により細かな消費者像を抽出している。こうした状況下、文学における登場人物のプロファイリングは恣意的だと物笑いの種になりかねない。文学者も流通しているデータをソフトで可視化し、それが物語るストーリーを作品のモデルにする。データは作家の想像力を上回る社会の一側面を示すだろう。そうした時代が来ている。

     

     先に述べた通り、データについて考える際に重要なのは、どのようなコンテクストを見出せるかだ。データは文学者に多様なコンテクストの存在を教えている。コンテクストを読み取る方法を提供しているとも言える。ビッグデータ時代のもたらすコンテクストに真摯に向き合うなら、文学は大いに進化していく。

     

     19世紀、西洋の自然主義文学者は、近代という未知の社会を自然科学を援用して描こうとしている。データ爆発の現在、改めて彼らの試みを見直す必要があるだろう。今日の文学者は過去とその作品の思想を共有し、自らを体系に位置づけながら、言語コミュニケーションによって今を浮き彫りにしようとする表現者のことである。

    〈了〉

    参照文献

    加藤周一、『20世紀の自画像』、ちくま新書、2005

    Data journalism Handbook

    http://datajournalismhandbook.org/

    Gartner

    http://www.gartner.com/technology/home.jsp

    IDC

    http://www.idc.com/

    Nature

    http://www.nature.com/nature/index.html


    スポンサーサイト

    • 2012.12.22 Saturday
    • 20:55
    • 0
      • -
      • -
      • -
      • -
      コメント
      コメントする








          
      この記事のトラックバックURL
      トラックバック

      PR

      calendar

      S M T W T F S
      1234567
      891011121314
      15161718192021
      22232425262728
      2930     
      << September 2019 >>

      吉本隆明論

      吉本隆明論

      アンビエントナリッジ

      selected entries

      categories

      archives

      recent comment

      recommend

      links

      profile

      search this site.

      others

      mobile

      qrcode

      powered

      無料ブログ作成サービス JUGEM