見出し画像

Society for Text & Discourse 2021に参加しました

昨年に引き続きオンライン開催となったSociety for Text & Discourseに,今年も参加しました。今年は自分の発表はなかったので純粋に参加者という形でしたが,プロポーザルの査読を初めてしました。(Program Review Commiteはこちら)。参加方法は一部リアルタイムのセッションが増えた他は,昨年と同じでFlipgridを使ったものでした(が,発表へのコメントが動画のみからTextでもできるようになった!)。

この学会は,談話(文章)レベルでの読み書き研究が発表の多くを占めます。小規模な学会でかつ第二言語の研究はわずかしかないですが,大規模でかつ第二言語研究が多くを占めるAAALなどの学会と比べても,実は自分の研究の参考になる発表が多かったりします。

以下,今年の発表で視聴したものをセッションごとにピックアップして,メモ程度に内容と感想を書いておきたいと思います。気にある発表があれば,リンクからアブストラクトを読むこともできます。(本来は査読したpreprintもアップロードされるはずなのですが,執筆時点で一部の発表しかアップロードされていません。動画が10分なのでもっと詳しい情報が欲しいときはpreprintを見たいんだけどなぁ…。)

Session 15: Standard Session I: Assessment

Kelsey Dreier, Zuowei Wang and Tenaha O'Reilly
Inconsistent Students’ Reading Comprehension in Traditional and Scenario-Based Assessments (abstract)

毎年発表しているETSの研究グループ。主要なテーマはScenario-Based Assessments (SBA) と呼ばれるもので,簡単に言うとタスクっぽいリーディングテストという感じ(こう描写するのは不適切かもしれないが)。今回はdemographic questionsの回答が1回目と2回目でずれるような受験者をlow engagementであるとして,このengagementによるパフォーマンスへの影響は伝統的な多肢選択式テストよりもSBAのほうが小さいですよということを示したもの。

Joon Suh Choi and Scott Crossley
ーReadability Assessment Tool for English Texts (abstract)

自分の研究でも使ったARTE (Automatic Readability Tool for English) のvalidationをthe Bormuth corpus と the Newsela corpusの2つを使って行った研究。ARTEはもともとデスクトップで使用するアプリケーションだが,現在オンライン版を準備しているそう。オンライン版ではいろいろと指標も増える予定らしい。

Session 16: Standard Session II: Conversation, Writing, & Language Production

Allison N. Sonia, Joseph P. Magliano, Kathryn S. McCarthy, Sarah D. Creer, Danielle S. McNamara and Laura K. Allen
Cohesion and Coherence-Building in Multiple Document Comprehension (abstract)

読解中の発話プロトコルをNLPツールで分析するという,ここ数年このグループが研究しているテーマ。今回は複数文章 (multiple documents) の読解,かつthink aloud, self-explanation, source evaluationの3つのタスクで産出されるプロトコルをTAACO(結束性を評価するツール)の語彙重複指標で分析している。within-docutmentとacross-documentにプロトコルを分けてそれぞれに語彙重複を評価してるんだけど,具体的にどんな内容のプロトコルでなぜ語彙重複が大事になるののかあまりイメージできない…。発話プロトコルをNLPで分析するってのは面白いんだけど,L2研究には応用しにくいなぁ(英語で発話しなくてはいけないので)。

Qian Wan, Scott Crossley, Laura Allen and Danielle McNamara
A Differential N-gram Use Measure for Automated Essay Scoring (abstract)

A differential word use (DWU) measureと呼ばれる語彙指標をn-gramに適用して,それがエッセイ得点を予測するかを検討した研究。モデルが訓練データにオーバーフィットするような結果になっているのだが,訓練データはL1 Englishで,テストデータがL2 Englishというのも原因になってそう。指標や回帰モデルについてはもう少し詳しく知りたいなぁ。

Session 17: Standard Session III: Developmental & Individual Differences

Meni Yeari
Centrality Skills of Poor Comprehenders (abstract)

Centrality Skillsとは,文章において主要な部分を特定する能力のこと。これが欠けていることをcentrality deficit とも言って,2011年にはL2学習者を対象とした研究がMemory & Cognitionに出ていたっけ。今回も基本的には同じような問題意識の研究で,Eye trackingも手法の1つに含まれているのだが,そちらでは興味深い結果は出ていない。Cenrility deficitはL2研究とも相性が良さそうだなと前から思っている。なお,今回発表した論文はSSSRRAWにすでに出版されているそう。

Rurik Tywoniw
Exploring Text-level Inferencing in Advanced Second Language Reading Comprehension Assessment Tasks (abstract)

L2読解テストとしてCloze test, Multiple Choice, Summaryの3つの形式を準備して,これらのパフォーマンスがSentence verification taskで測定される推論能力によってどの程度予測されるかを検討した研究。L2読解中の推論は自分の博論テーマでもあったので興味深い内容だが,もっとも肝心な推論の具体的な種類や内容が分からなかったので何とも。

Zuowei Wang, Kelly Bruce, Tenaha O'Reilly, Beata Beigman Klebanov and John Sabatini
An exploration of word learning opportunities in children's books (abstract)

これもETSの研究グループで,子供向けの本を対象にETS grade level (ETS GL) という語彙データベースを使ってどのくらい馴染みの無い語彙が含まれているかを分析した研究。各本に付与されているGrade levelよりもETS GLが高い語彙をunfamiliar wordsと定義しているのかな?このデータベース(についての情報)も近日公開されるそう。

Yu Tian, Minkyung Kim and Scott Crossley
Classifying Discourse Elements in L2 Argumentative Essays Using Writing Fluency Measures (abstract)

keystroke log informationから得られるWriting fleuncyの指標を使って,final claim, primary claim, counterclaimのような談話の要素の産出を予測できるかを検討した研究。結果としては例えばpauseが少ないときにはprimary claimが出やすいみたいなことが示されているんだけど,それが理論的にどう意味があるのかはちょっと分からなかった。

Session 18: Standard Session IV: Discourse Analysis, Cohesion, & Readability

Scott Crossley, Joon Suh Choi, Aron Heintz, Jordan Batchelor, Mehrnoush Karimi and Agnes Malatinszky
A Large-Scale Corpus for Developing Readability Formulas (abstract)

前に読んだCLEAR Corpusの発表と大体同じだった思うけど,データセットを公開してReadability推定のためのアルゴリズムを作るCompetition(主にデータサイエンティスト向け)を開催しているらしい。

Scott Crossley, Perpetual Baffour, Yu Tian, Aigner Picou, Meg Benner and Ulrich Boser
A Large-Scale Corpus for Assessing Discourse Elements in Writing (abstract)

こちらは400,000件以上のArgumentative essayのコーパスで,position <-- claim <-- evidenceのような(本当はもうちょっと複雑)文章に含まれる談話要素とそれらの関係が人手でアノテーションされている。こちらも上の発表と同じく,エッセイ評価のアルゴリズムを作るCompetitionを開催しているらしい。談話要素がアノテーションされているってのは面白いね。

Kole Norberg, Charles Perfettti and Anne Helder
Word-to-Text Integration and Antecedent Accessibility: Eye-Tracking Evidence Extends Results of ERPs (abstract)

Word-to-Text Integraionは平たく言えば読解中に出会った単語を前の文脈に結びつけるようなことで(厳密にはいろんなパターンがあるが),結構いろいろな研究がされている。この研究ではpictureを前の文脈のphotographと結び付けたり,そのことにタイトルのような大局的な文脈が影響を与えるのかを検討している。これぞ文章理解研究というような綿密な実験計画と方法で,Eye-trackingとERPも非常にうまく使われているので大変勉強になった(内容はちょっと難しいけど)。Word-to-Text Integraionは調べてみると,割とL2学習者対象でも行われている研究みたい。


来年は対面を予定

本来,昨年はAtlanta,今年はノルウェーのOsloでしたが,それぞれ2022年,2023年へとずれて開催される予定のようです。参加したいとも思いますが,まだワクチン接種の予約すらできていない私は海外学会に参加できるのはいつになることやら…。(たとえワクチン接種をしたとしても,一般の人が何の条件もなしに海外に行くことができるようになるのはまだ時間がかかりそうだなぁ)



いいなと思ったら応援しよう!