ようこそ ゲスト さん
ログイン
入力補助
English
Top
ブラウズ
著者
出版年
雑誌名
資料種別
ランキング
アクセスランキング
ダウンロードランキング
その他
成果物の登録方法
大東文化大学図書館HP
このアイテムのアクセス数:
106
件
(
2025-01-05
19:19 集計
)
閲覧可能ファイル
ファイル
フォーマット
サイズ
閲覧回数
説明
AN10065440-20180301-014
pdf
2.03 MB
93
論文情報
タイトル
コーパスから抽出した用例に含まれるノイズへの対応
タイトル(別表記)
コーパス カラ チュウシュツ シタ ヨウレイ ニ フクマレル ノイズ エノ タイオウ
Evaluation of the influence of retrieval errors in corpus-based studies of Japanese
著者名
著者/ヨミ/別表記
上村, 圭介
カミムラ, ケイスケ
KAMIMURA, Keisuke
著者/ヨミ/別表記
髙野, 愛子
タカノ, アイコ
TAKANO, Aiko
主題
コーパス
データクリーニング
ノイズ
全数チェック
抄録・概要
本稿では現代日本語書き言葉均衡コーパス(BCCWJ)から抽出した順接接続詞の用例に対する全件チェックの結果をもとに、抽出ノイズが分析結果に及ぼす影響を検討した。対象接続詞別に抽出結果の適合率と再現率を明らかにし、接続詞によっては形態素情報を利用した抽出条件では見逃してしまう用例が多数含まれることが分かった。さらに、接続詞別の出現頻度は抽出ノイズの前後で同等性が棄却されること、および対応分析の次元得点を利用したクラスター解析の結果に異同が生じることを確認した。本稿の分析から、コーパスから得られる用例については、その適否についての精査が必要であることが改めて示されたほか、大規模であるとしてもコーパスは有限であり、全数チェックによるデータ精査の結果をコーパスの改善に結び付けることが必要であると結論付けた。
掲載誌名
語学教育研究論叢
NCID
AN10065440
ISSN
09118128
巻
35
開始ページ
239
終了ページ
256
刊行年月日
2018-03-01
言語
日本語
資料種別(NII)
紀要論文
コンテンツの種類
紀要論文
著者版フラグ
publisher
ホームへ戻る