2024年3月15日(金)

一橋講堂(千代田区一ツ橋)[地図]/Webinar

現地参加申込みフオーム(同時通訳付)

オンライン(Webinar)参加申込み(同時通訳無)【新規追加】

共催:九州大学人文科学研究院/一般財団法人人文情報学研究所

関連イベント:「接続する人文学」@九州大学伊都キャンパス

開催趣旨


 1000万冊以上のデジタル化資料を提供するHathiTrust デジタルライブラリに象徴されるように、人文学の研究対象たる資料は人がすべてに目を通すことは不可能な状況となって久しい。このような状況では、膨大な資料のすべてを読むことなく、しかし人が読める量を凌駕する大量の資料を対象として妥当な研究を行う手法が求められつつある。「遠読(Distant Reading)」は、まさにそれに取り組む文学研究の手法として提唱され、徐々に国際的に広がってきている。そして、北米ではそれを支援するための研究データ基盤としてのHathiTrust Research Centerが各地の研究者に活用されるようになってきている。本シンポジウムでは、イリノイ大学より、この課題に取り組む文学研究者Ted Underwood教授、及びその研究基盤を提供するHathiTrust Research Center共同所長のJ. Stephen Downie教授を招聘し、そのような状況に日本がどう対応し得るか登壇者・参加者の皆様と検討する機会としたい。

基調講演

Ted Underwood

「機械学習時代に変わりゆく文学をつかまえること」


文学を量的に分析しようというのはなにも新しい思いつきではない。二〇世紀初頭より(英国でも日本でも)文学研究者が都度手を出してきたものだ。だが二〇世紀に測れたのは語彙頻度や文の長さであり、かならずしも明確な文学的意義に結びつかないものだった。機械学習の登場で状況は一変した。たんに分析規模が拡大したからではない。読者にとってもともと意義がある事象を測れるようになったからだ。たとえば語りの速度、登場人物のジェンダー・ロールのようなものだ。本講演では、機械学習をどう用いれば、小説のそういった側面が浮き彫りになるかだけでなく、文学の変化にまで敷衍できるのかをお示しする。また、生成AIをつかって私たちが取り組みはじめた新たな問題についても紹介したい。

【講演者略歴】

イリノイ大学アーバナ・シャンペーン校情報学部及び教養学部英文学科教授。18~19世紀の文学について、馴染みのある批評的手法で解説した2冊の本を執筆した後、大規模なデジタル・ライブラリーがもたらす新たな可能性に着目。それ以来、彼の研究は、何百冊、何千冊という本を一度に検討する際に、長い時間軸の中で見えてくる文学のパターンを探求してきた。例えば最近では、機械学習を利用して、探偵小説とSFが別個のジャンルとして統合された過程を追跡したり、1780年から現在に至るまで、文学の人物描写の中で明らかになったジェンダーに関する思い込みの移り変わりを説明したりしている。

文学史に関する著書に『遠い地平線 Distant Horizons』(シカゴ大学出版局、2019年)、『なぜ文学の時代区分は重要だったのか:歴史的対比と英語研究の威信』(スタンフォード大学出版局、2013年)、『太陽の仕事:文学、科学、政治経済 1760-1860』 (New York: Palgrave, 2005)がある。

J. Stephen Downie


「研究者がキュレーションした分析、再利用、普及のためのワークセット(SCWAReD)プロジェクト」


アンドリュー・W・メロン財団から資金提供を受けた「SCWAReDプロジェクト」は、2021年から2023年までHathiTrust研究センター(HTRC)が主導し、インディアナ大学、カンザス大学、イリノイ大学からプロジェクト・リーダーが選出された。プロジェクトには2つの主な目標がある。 一つは、十分なサービスを受けていない文献を研究者主導で収集・分析することで、HathiTrustのデータのより広範で多様な利用を促すこと。もう一つは、研究者が未開拓文献の分析を完了するために必要なものと、HathiTrustコレクションに実際に所蔵されているものとの間にギャップがないかを検討することである。本講演では、多様で従来は十分に活用されてこなかったテキストを扱うSCWAReDの研究者たちの仕事を紹介する。また、HathiTrustのコーパスの分析に利用可能な項目と、研究者が理解する研究者コレクションのギャップについて、プロジェクトの成果を紹介する。

【講演者略歴】

イリノイ大学アーバナ・シャンペーン校情報学部研究担当副学部長・教授。HathiTrust研究センター(HTRC)のイリノイ共同所長。HathiTrust+ブックワーム(HT+BW)テキスト分析プロジェクトの研究代表者を務め、全米人文科学基金(NEH)の資金援助を受けて、用語の経年変化を可視化するツールを作成している。Downie教授は、メロン財団が資金を提供したScholar-Curated Worksets for Analysis, Reuse & Dissemination(SCWAReD)プロジェクトの共同研究代表者でもある。現在は、HathiTrustとのTools for Open Research and Computationの共同研究代表者: Leveraging Intelligent Text Extraction (TORCHLITE)プロジェクトの共同研究代表者。以上のプロジェクトのすべては、著作権で制限された文化データへの大規模な分析的アクセスを提供しようと努力しているという点で共通するものである。

プログラム 

総合司会 中川奈津子(九州大学大学院人文科学研究院)

第一部 ビッグデータ・文学研究・日本での可能性 司会 橋本健広(中央大学国際情報学部)

第二部 デジタル研究基盤と文学研究 司会 永崎研宣(一般財団法人人文情報学研究所)


司会 中川奈津子九州大学大学院人文科学研究院