A Publicly Available Indonesian Corpora for Automatic Abstractive and Extractive Chat Summarization by Fajri Koto ’16

Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016)
http://www.lrec-conf.org/proceedings/lrec2016/summaries/366.html
http://www.lrec-conf.org/proceedings/lrec2016/pdf/366_Paper.pdf

インドネシア語のチャットの要約研究のため、コーパスを作った話。
手作業で要約を生成するツールなども作成。Extractiveな要約とAbstractiveな要約の両方がデータに含まれている。チャット要約の性能評価のための尺度も作った。(ROUGH-NとROUGH-LCS)

機械要約のためのアルゴリズムを提案しているわけではない。
Related Workにチャット要約研究へのポインタが結構あるのがうれしい。

コーパスにアクセスしたい人は、fajri.phd@gmail.comまで、所属と目的を送ってほしいとのこと。