2024/3/5 日本語小論文データに対してルーブリックに基づくタグを付与したデータを公開

日本語小論文データに対してルーブリックに基づくタグを付与したデータをgithub上に公開しました.小論文の採点の際,ルーブリックに基づく観点で採点を行っています.その観点に関連する表現が小論文のどこに対応しているかをタグづけしたものです.2名の作業者でタグづけを行った結果を公開しています.

githubの公開先はこちらです.https://github.com/takenl2021/jp_essay_tag

公開データにはタグ付与された部分のテキストと文字の位置が記録されたjson形式のデータです.ですので,小論文の回答文書全体や採点スコアは言語資源協会からダウンロード (GSK2021-B https://www.gsk.or.jp/catalog/gsk2021-b/)して利用してください.

2024/10/20 Boagoさんが7th International Conference on Natural Language and Speech Processing で発表しました

博士課程のBoagoさんが、7th International Conference on Natural Language and Speech Processing で 「Modeling Score Estimation for Japanese Essays with Generative Pre-trained Transformers」というタイトルで発表しました。

会議誌は ACL Anthology上にupされています。 https://aclanthology.org/2024.icnlsp-1.8/

Gradioで出力を2つ同時に出す方法 (2024/2/25)

Gradio簡単にテキストの入力と出力のインターフェースをもつWebサイトを作成できるのですが,2つのモデルを作成して,その出力を同時に出したい場合にどうするかが,ちょっと調べてもでてなかったので記しておきます (gradio.mix Parallel というのがあったかもしれませんが,下記にように普通に書けます).

下記のようなコードになります

import gradio as gr

model1_label = "実装例1."
model2_label = "実装例2."

def greet(name, intensity):
    out1 = "Hello " * intensity + name + "!"
    out2 = "haha " * intensity + name + "!"
    return out1,out2


demo1= gr.Interface(
    fn = greet,
    inputs = [
        gr.Textbox(lines=5, label="入力テキスト"),
        gr.Slider(1, 10, step=1, label="何個事例を入れるか"),
    ],
    outputs = [
        gr.Textbox(label=model1_label), 
        gr.Textbox(label=model2_label)
    ],
    allow_flagging='never',
)

demo1.launch(server_name="0.0.0.0", server_port=7877, share=True)

結局,出力の部分で textを2つ出力させるようにします.表示は下記のようになります.

参考 https://www.gradio.app/guides/quickstart