筑波ウェブコーパス Tsukuba Web Corpus 日本 20240802
#TsukubaWebCorpus #Tsukuba #Web #Corpus #BalancedCorpusOfContemporaryWrittenJapanese #BCCWJ
https://www.youtube.com/watch?v=BP5Fl_9fVow
Tsukuba Web Corpusのご紹介 - YouTube
20211213
https://www.intersc.tsukuba.ac.jp/~kyoten/twc/
筑波ウェブコーパス - 筑波大学日本語・日本事情遠隔教育拠点
ウェブサイトから構築した11億語の大規模日本語コーパスです。 検索ツール(NINJAL-LWP for TWC)で、語彙の共起関係などを調べることができます。
https://tsukubawebcorpus.jp/search/
利用規約 ┃ NINJAL-LWP for TWC
https://nlb.ninjal.ac.jp/
NINJAL-LWP for BCCWJ (NLB)
は
NINJAL-LWP for BCCWJ(以下、NLB)は、国立国語研究所(以下、国語研)が構築した『現代日本語書き言葉均衡コーパス』(Balanced Corpus of Contemporary Written Japanese: BCCWJ)を検索するために、国語研とLago言語研究所が共同開発したオンライン検索システムです。国語研の共同研究プロジェクト「日本語学習者用基本動詞用法ハンドブックの作成」(リーダー:プラシャント・パルデシ)、「日本語レキシコンの文法的・意味的・形態的特性」(リーダー:影山太郎)、「述語構造の意味範疇の普遍性と多様性」(リーダー:プラシャント・パルデシ)による研究成果の一部です。
国語研からはBCCWJ用のオンラインコンコーダンサとして中納言が公開されていますが、NLBはコンコーダンサとは異なるレキシカルプロファイリングという手法を用いたコーパス検索ツールです。名詞や動詞などの内容語の共起関係や文法的振る舞いを網羅的に表示できるのが最大の特長です。同じシステムを利用したツールに、筑波大学が構築した11億語のウェブコーパス『筑波ウェブコーパス』(Tsukuba Web Corpus: TWC)を検索するNINJAL-LWP for TWC(NLT)があります。
#国立 #国語 #研究所 #構築 #現代 #日本語 #書き言葉 #均衡 #コーパス #検索 #Lago #言語 #研究 #共同 #開発 #オンライン #システム #プロジェクト #日本語学習者用基本動詞用法ハンドブックの作成 #プラシャント・パルデシ #日本語レキシコンの文法的・意味的・形態的特性 #影山太郎 #述語構造の意味範疇の普遍性と多様性 #オンライン #コンコーダンサ #中納言 #公開 #レキシカルプロファイリング #手法 #ツール #名詞 #動詞 #内容語 #共起関係 #文法的振る舞い #網羅的 #表示 #特長 #筑波大学 #構築 #11億語 #ウェブコーパス #筑波ウェブコーパス #日本 #20240802
#fictitiousness #2024
いいなと思ったら応援しよう!
