JaWildText: 日本語文字認識性能評価のための実世界画像データセット

前田, 航希, 岡崎, 直観

言語処理学会第32回年次大会 (NLP2026) · March 2026

日本語の実世界画像における文字認識と下流タスクを一体的に評価するためのデータセット JaWildText を提案する。高密度 STVQA、レシート KIE、手書き文字 OCR の 3 つの課題を収録し、公開 VLM および OCR 特化モデルの評価を通じて、日本語読字性能になお改善余地があることを示した。NLP2026 委員特別賞受賞論文。

BibTeX

@inproceedings{maeda2026jawildtext_domestic,
  author = {前田 航希 and 岡崎 直観},
  title = {JaWildText: 日本語文字認識性能評価のための実世界画像データセット},
  booktitle = {言語処理学会第32回年次大会 (NLP2026)},
  pages = {613--618},
  year = {2026},
  month = mar,
  address = {宇都宮}
}

PDF