SlideShare a Scribd company logo
1 of 36
人狼BBSにおける発話の
自動分類
福井敬徳
経営情報科学研究科
愛知工業大学
目次
•研究背景
•目的と問題点
•提案手法
•標本データの作成
•実験
•結果と考察
•まとめと今後の課題
研究背景
• 人狼ゲーム
• 人狼知能プロジェクト
• 人狼BBS
• 村人役と人狼役の2つの陣営に分かれる
• 話し合いによって他のプレイヤの正体を探る
• 村人と人狼は互いの排除を目指す
村人側
人狼側
人狼ゲーム
人狼知能プロジェクト
人間と人狼ゲームを楽しめる人工知能
人狼知能
人狼BBSの特徴
• 様々なプレイヤが
ゲームに参加
偏りのないデータが取得
できる
人狼BBSの特徴
• 様々なプレイヤが
ゲームに参加
• 文字列のみでの
コミュニケーション
表情や仕草などの
情報がなく
計算機上で扱いやすい
人狼BBSの特徴
• 様々なプレイヤが
ゲームに参加
• 文字列のみでの
コミュニケーション
• 1700ゲーム以上のロ
グが存在
人狼ゲームの記録として
の利用が可能
目的と問題点
• 本研究の目的
• 問題点
本研究の目的
人狼BBSに参加可能な
人狼エージェントの構築
2.状況に応じた発話の決定
3.発話の生成
1.ゲーム状況の確認,言語理解
問題点
人狼知能の発話
人間による発話
人間 人狼知能
言語理解
多種多様な発話が存在するため
解析が困難
プレイヤ 人狼BBS
状況に応じた発話の決定
発話の生成
多種多様な会話
• ロールプレイのための会話
• 略語や慣例となった表現を用いた会話
• 不完全な文での会話
提案手法
• 話題分類
• サポートベクターマシン
話題分類
……
話題分類
大まかな内容の分類
発話内容の解釈の一段階とする
分類対象
• Comingout
• 自分の役職の公開または限定
• Divined_Inquested
• 占いの結果または霊能の結果
• Guard
• 護衛したプレイヤの報告
• Vote
• 投票先プレイヤの宣言
• Estimate
• 他のプレイヤの役職の予想
私は占い師では
ありません
○○を護衛した
○○は人狼だと
思う
発話の分類の方法
SVMを用いて「その話題」か
否かを識別することで分類
「その話題」を示している
「その話題」を示していない
負例
正例
作成する分類器数
Comingout
Divined
Inquested
Estimate
Vote
Guard
学習に必要なデータの作成
標本
データ
…
… 標本データの
作成学習に必要なデータの
作成
Border
標本データの作成
標本データの作成手順
文の分割
フィルタ
リング
ラベリ
ング
フィルタ
情報人狼BBS
標本
データ
Step 1 Step 2 Step 3
ステップ1: 文の分割
フィルター
untag
untag
untag
untag
vote?
guard?
ステップ3へ
ステップ2:フィルタリング
Matching
明らかにどの話題にも
分類されない文
Speech content タグ
BBSから抽出さ
れた文
分類される
話題
or
「untag」
Example
対
ステップ3:ラベリング
I am Psychic!
【私が霊能者だよー!】␣Comingout
Topics Number of
Sample-data
Comingout 248
Divined_Inquested 136
Vote 470
Estimate 412
Guard 16
標本データの数
役職に関係なく収
集される標本デー
タ「○○を護衛した」と発言
すると人狼に狙われる可能
性が高い=発言が少ない
実験
• 標本データの前処理
• K-分割交差検証
標本データの前処理(1/2)
正例数と負例数を一致させることにより
偏った学習を防ぐ
正例
負例
負例
負例
標本データの前処理(2/2)
• 形態素解析エンジンで単語に分解
• それぞれの単語にIDを割り当て
• 単語ID の出現回数をカウント
標本
データ
【私が霊能者だよー!】
【/私が/霊能者/だよ/ー/!/】
2:2 13:1 43:1 51:1 84:1 123:1
結果
最終結果
0.896
0.889
0.927
0.871
Kの数だけ標本データを分割する
1
2
K=3
トレーニングデータテストデータ
K-分割交差検証
結果と考察
話題分類の結果(1/2)
0%
20%
40%
60%
80%
100%
役職の公開 種族の判定 投票先の宣言 役職の予想 護衛の報告
Comingout Div_Inq Vote Estimate Guard
短文 &
シンプルな構文
誤分類した文
• Comingout(役職の公開)
《誤って分類された例》
【この国で最初に負傷した男 CO】 (負例)
【おかんってば死者の霊がみえるようになって
た! 】(正例)
• Divined_Inquested(占い・霊能結果の報告)
《誤った分類された例》
女は狼なんですね(負例)
話題分類の結果(2/2)
0%
20%
40%
60%
80%
100%
役職の公開 種族の判定 投票先の宣言 役職の予想 護衛の報告
Comingout Div_Inq Vote Estimate Guard
不十分なデータ数
人狼に襲撃される恐れがあるため
発言される機会が少ない話題
まとめと
今後の課題
まとめ
• SVMを用いた機械学習手法の提案
• 機械学習のための標本データの作成
• 検証方法としてK-分割交差検証を行った
• 一部の話題では高い精度を得られた
今後の課題
• より多くの標本データの作成
• 標本データ作成手順の改良
• ニューラルネットワークへの適用
Questions Please

More Related Content

What's hot

Go静的解析ハンズオン
Go静的解析ハンズオンGo静的解析ハンズオン
Go静的解析ハンズオンTakuya Ueda
 
PythonとPyCoRAMでお手軽にFPGAシステムを開発してみよう
PythonとPyCoRAMでお手軽にFPGAシステムを開発してみようPythonとPyCoRAMでお手軽にFPGAシステムを開発してみよう
PythonとPyCoRAMでお手軽にFPGAシステムを開発してみようShinya Takamaeda-Y
 
Java8から17へ
Java8から17へJava8から17へ
Java8から17へonozaty
 
基礎からのOAuth 2.0とSpring Security 5.1による実装
基礎からのOAuth 2.0とSpring Security 5.1による実装基礎からのOAuth 2.0とSpring Security 5.1による実装
基礎からのOAuth 2.0とSpring Security 5.1による実装Masatoshi Tada
 
Spring Social でソーシャルログインを実装する
Spring Social でソーシャルログインを実装するSpring Social でソーシャルログインを実装する
Spring Social でソーシャルログインを実装するRakuten Group, Inc.
 
FD.io VPP事始め
FD.io VPP事始めFD.io VPP事始め
FD.io VPP事始めtetsusat
 
AWS Security JAWS 経済的にハニーポットのログ分析をするためのベストプラクティス?
AWS Security JAWS 経済的にハニーポットのログ分析をするためのベストプラクティス?AWS Security JAWS 経済的にハニーポットのログ分析をするためのベストプラクティス?
AWS Security JAWS 経済的にハニーポットのログ分析をするためのベストプラクティス?Masamitsu Maehara
 
Design by contractとホーア論理
Design by contractとホーア論理Design by contractとホーア論理
Design by contractとホーア論理Takuya Matsunaga
 
FD.io VPP tap-inject with sample_plugins
FD.io VPP tap-inject with sample_pluginsFD.io VPP tap-inject with sample_plugins
FD.io VPP tap-inject with sample_pluginsNaoto MATSUMOTO
 
人生がときめくAPIテスト自動化 with Karate
人生がときめくAPIテスト自動化 with Karate人生がときめくAPIテスト自動化 with Karate
人生がときめくAPIテスト自動化 with KarateTakanori Suzuki
 
TCP/IPプロトコルスタック自作入門
TCP/IPプロトコルスタック自作入門TCP/IPプロトコルスタック自作入門
TCP/IPプロトコルスタック自作入門雅也 山本
 
Lightweight Keycloak
Lightweight KeycloakLightweight Keycloak
Lightweight KeycloakHiroyuki Wada
 
ネットワークが切れても大丈夫!リアルタイムWebアプリケーションを簡単開発するフレームワーク Winter Cardinalのご紹介
ネットワークが切れても大丈夫!リアルタイムWebアプリケーションを簡単開発するフレームワーク Winter Cardinalのご紹介ネットワークが切れても大丈夫!リアルタイムWebアプリケーションを簡単開発するフレームワーク Winter Cardinalのご紹介
ネットワークが切れても大丈夫!リアルタイムWebアプリケーションを簡単開発するフレームワーク Winter Cardinalのご紹介NobuyasuNakajima2
 
WikipediaからのSolr用類義語辞書の自動生成
WikipediaからのSolr用類義語辞書の自動生成WikipediaからのSolr用類義語辞書の自動生成
WikipediaからのSolr用類義語辞書の自動生成Koji Sekiguchi
 
虫食算に学ぶ、深さ優先探索アルゴリズム (combmof, 2018/12/23)
虫食算に学ぶ、深さ優先探索アルゴリズム (combmof, 2018/12/23)虫食算に学ぶ、深さ優先探索アルゴリズム (combmof, 2018/12/23)
虫食算に学ぶ、深さ優先探索アルゴリズム (combmof, 2018/12/23)Kensuke Otsuki
 
VyOSで作るIPv4 Router/IPv6 Bridge
VyOSで作るIPv4 Router/IPv6 BridgeVyOSで作るIPv4 Router/IPv6 Bridge
VyOSで作るIPv4 Router/IPv6 BridgeKLab Inc. / Tech
 
関数型言語ElixirのIoTシステム開発への展開
関数型言語ElixirのIoTシステム開発への展開関数型言語ElixirのIoTシステム開発への展開
関数型言語ElixirのIoTシステム開発への展開Hideki Takase
 

What's hot (20)

Go静的解析ハンズオン
Go静的解析ハンズオンGo静的解析ハンズオン
Go静的解析ハンズオン
 
PythonとPyCoRAMでお手軽にFPGAシステムを開発してみよう
PythonとPyCoRAMでお手軽にFPGAシステムを開発してみようPythonとPyCoRAMでお手軽にFPGAシステムを開発してみよう
PythonとPyCoRAMでお手軽にFPGAシステムを開発してみよう
 
Java8から17へ
Java8から17へJava8から17へ
Java8から17へ
 
基礎からのOAuth 2.0とSpring Security 5.1による実装
基礎からのOAuth 2.0とSpring Security 5.1による実装基礎からのOAuth 2.0とSpring Security 5.1による実装
基礎からのOAuth 2.0とSpring Security 5.1による実装
 
Spring Social でソーシャルログインを実装する
Spring Social でソーシャルログインを実装するSpring Social でソーシャルログインを実装する
Spring Social でソーシャルログインを実装する
 
EVPN for Cloud Builders
EVPN for Cloud BuildersEVPN for Cloud Builders
EVPN for Cloud Builders
 
FD.io VPP事始め
FD.io VPP事始めFD.io VPP事始め
FD.io VPP事始め
 
AWS Security JAWS 経済的にハニーポットのログ分析をするためのベストプラクティス?
AWS Security JAWS 経済的にハニーポットのログ分析をするためのベストプラクティス?AWS Security JAWS 経済的にハニーポットのログ分析をするためのベストプラクティス?
AWS Security JAWS 経済的にハニーポットのログ分析をするためのベストプラクティス?
 
Design by contractとホーア論理
Design by contractとホーア論理Design by contractとホーア論理
Design by contractとホーア論理
 
FD.io VPP tap-inject with sample_plugins
FD.io VPP tap-inject with sample_pluginsFD.io VPP tap-inject with sample_plugins
FD.io VPP tap-inject with sample_plugins
 
人生がときめくAPIテスト自動化 with Karate
人生がときめくAPIテスト自動化 with Karate人生がときめくAPIテスト自動化 with Karate
人生がときめくAPIテスト自動化 with Karate
 
TCP/IPプロトコルスタック自作入門
TCP/IPプロトコルスタック自作入門TCP/IPプロトコルスタック自作入門
TCP/IPプロトコルスタック自作入門
 
Lightweight Keycloak
Lightweight KeycloakLightweight Keycloak
Lightweight Keycloak
 
ネットワークが切れても大丈夫!リアルタイムWebアプリケーションを簡単開発するフレームワーク Winter Cardinalのご紹介
ネットワークが切れても大丈夫!リアルタイムWebアプリケーションを簡単開発するフレームワーク Winter Cardinalのご紹介ネットワークが切れても大丈夫!リアルタイムWebアプリケーションを簡単開発するフレームワーク Winter Cardinalのご紹介
ネットワークが切れても大丈夫!リアルタイムWebアプリケーションを簡単開発するフレームワーク Winter Cardinalのご紹介
 
WikipediaからのSolr用類義語辞書の自動生成
WikipediaからのSolr用類義語辞書の自動生成WikipediaからのSolr用類義語辞書の自動生成
WikipediaからのSolr用類義語辞書の自動生成
 
AS45679 on FreeBSD
AS45679 on FreeBSDAS45679 on FreeBSD
AS45679 on FreeBSD
 
虫食算に学ぶ、深さ優先探索アルゴリズム (combmof, 2018/12/23)
虫食算に学ぶ、深さ優先探索アルゴリズム (combmof, 2018/12/23)虫食算に学ぶ、深さ優先探索アルゴリズム (combmof, 2018/12/23)
虫食算に学ぶ、深さ優先探索アルゴリズム (combmof, 2018/12/23)
 
VyOSで作るIPv4 Router/IPv6 Bridge
VyOSで作るIPv4 Router/IPv6 BridgeVyOSで作るIPv4 Router/IPv6 Bridge
VyOSで作るIPv4 Router/IPv6 Bridge
 
IIJmio meeting 9 IIJのモバイル&バックボーンインフラ
IIJmio meeting 9 IIJのモバイル&バックボーンインフラIIJmio meeting 9 IIJのモバイル&バックボーンインフラ
IIJmio meeting 9 IIJのモバイル&バックボーンインフラ
 
関数型言語ElixirのIoTシステム開発への展開
関数型言語ElixirのIoTシステム開発への展開関数型言語ElixirのIoTシステム開発への展開
関数型言語ElixirのIoTシステム開発への展開
 

Similar to 人狼BBSにおける発話の自動分類

シス研下級生向け
シス研下級生向けシス研下級生向け
シス研下級生向けKunisada Ryouta
 
2018人工知能学会合同研究会発表資料
2018人工知能学会合同研究会発表資料2018人工知能学会合同研究会発表資料
2018人工知能学会合同研究会発表資料Takanori Fukui
 
写真の撮り方
写真の撮り方写真の撮り方
写真の撮り方Kenji Ono
 
神奈川電子技術研究所 あかんゲームといいゲーム
神奈川電子技術研究所 あかんゲームといいゲーム神奈川電子技術研究所 あかんゲームといいゲーム
神奈川電子技術研究所 あかんゲームといいゲームIGDA Japan
 
ゲームオブジェクトの管理
ゲームオブジェクトの管理ゲームオブジェクトの管理
ゲームオブジェクトの管理Shota Homma
 
知能が作る社会・社会が作る知能:HAI研究による知能と社会のデザイン(大澤 博隆)
知能が作る社会・社会が作る知能:HAI研究による知能と社会のデザイン(大澤 博隆)知能が作る社会・社会が作る知能:HAI研究による知能と社会のデザイン(大澤 博隆)
知能が作る社会・社会が作る知能:HAI研究による知能と社会のデザイン(大澤 博隆)KIT Cognitive Interaction Design
 
KLab Expert Camp 成果発表
KLab Expert Camp 成果発表KLab Expert Camp 成果発表
KLab Expert Camp 成果発表yosswi414
 
誰の為にVRコンテンツを作るのか
誰の為にVRコンテンツを作るのか誰の為にVRコンテンツを作るのか
誰の為にVRコンテンツを作るのか佑樹 石井
 
クリエイティブな人のための哲学塾
クリエイティブな人のための哲学塾クリエイティブな人のための哲学塾
クリエイティブな人のための哲学塾Youichiro Miyake
 

Similar to 人狼BBSにおける発話の自動分類 (9)

シス研下級生向け
シス研下級生向けシス研下級生向け
シス研下級生向け
 
2018人工知能学会合同研究会発表資料
2018人工知能学会合同研究会発表資料2018人工知能学会合同研究会発表資料
2018人工知能学会合同研究会発表資料
 
写真の撮り方
写真の撮り方写真の撮り方
写真の撮り方
 
神奈川電子技術研究所 あかんゲームといいゲーム
神奈川電子技術研究所 あかんゲームといいゲーム神奈川電子技術研究所 あかんゲームといいゲーム
神奈川電子技術研究所 あかんゲームといいゲーム
 
ゲームオブジェクトの管理
ゲームオブジェクトの管理ゲームオブジェクトの管理
ゲームオブジェクトの管理
 
知能が作る社会・社会が作る知能:HAI研究による知能と社会のデザイン(大澤 博隆)
知能が作る社会・社会が作る知能:HAI研究による知能と社会のデザイン(大澤 博隆)知能が作る社会・社会が作る知能:HAI研究による知能と社会のデザイン(大澤 博隆)
知能が作る社会・社会が作る知能:HAI研究による知能と社会のデザイン(大澤 博隆)
 
KLab Expert Camp 成果発表
KLab Expert Camp 成果発表KLab Expert Camp 成果発表
KLab Expert Camp 成果発表
 
誰の為にVRコンテンツを作るのか
誰の為にVRコンテンツを作るのか誰の為にVRコンテンツを作るのか
誰の為にVRコンテンツを作るのか
 
クリエイティブな人のための哲学塾
クリエイティブな人のための哲学塾クリエイティブな人のための哲学塾
クリエイティブな人のための哲学塾
 

More from Takanori Fukui

著者:結城 浩-『プログラマの数学』の第8章をスライド資料にしたもの
著者:結城 浩-『プログラマの数学』の第8章をスライド資料にしたもの著者:結城 浩-『プログラマの数学』の第8章をスライド資料にしたもの
著者:結城 浩-『プログラマの数学』の第8章をスライド資料にしたものTakanori Fukui
 
論文の書き方(研究室用)
論文の書き方(研究室用)論文の書き方(研究室用)
論文の書き方(研究室用)Takanori Fukui
 
著者:結城 浩-『プログラマの数学』の第1章をスライド資料にしたもの
著者:結城 浩-『プログラマの数学』の第1章をスライド資料にしたもの著者:結城 浩-『プログラマの数学』の第1章をスライド資料にしたもの
著者:結城 浩-『プログラマの数学』の第1章をスライド資料にしたものTakanori Fukui
 
Gat2017-AITWolfアルゴリズム紹介
Gat2017-AITWolfアルゴリズム紹介Gat2017-AITWolfアルゴリズム紹介
Gat2017-AITWolfアルゴリズム紹介Takanori Fukui
 
Automatic classification of remarks in Werewolf BBS
Automatic classification of remarks in Werewolf BBSAutomatic classification of remarks in Werewolf BBS
Automatic classification of remarks in Werewolf BBSTakanori Fukui
 
Up ai wolfプレゼン資料
Up ai wolfプレゼン資料Up ai wolfプレゼン資料
Up ai wolfプレゼン資料Takanori Fukui
 

More from Takanori Fukui (6)

著者:結城 浩-『プログラマの数学』の第8章をスライド資料にしたもの
著者:結城 浩-『プログラマの数学』の第8章をスライド資料にしたもの著者:結城 浩-『プログラマの数学』の第8章をスライド資料にしたもの
著者:結城 浩-『プログラマの数学』の第8章をスライド資料にしたもの
 
論文の書き方(研究室用)
論文の書き方(研究室用)論文の書き方(研究室用)
論文の書き方(研究室用)
 
著者:結城 浩-『プログラマの数学』の第1章をスライド資料にしたもの
著者:結城 浩-『プログラマの数学』の第1章をスライド資料にしたもの著者:結城 浩-『プログラマの数学』の第1章をスライド資料にしたもの
著者:結城 浩-『プログラマの数学』の第1章をスライド資料にしたもの
 
Gat2017-AITWolfアルゴリズム紹介
Gat2017-AITWolfアルゴリズム紹介Gat2017-AITWolfアルゴリズム紹介
Gat2017-AITWolfアルゴリズム紹介
 
Automatic classification of remarks in Werewolf BBS
Automatic classification of remarks in Werewolf BBSAutomatic classification of remarks in Werewolf BBS
Automatic classification of remarks in Werewolf BBS
 
Up ai wolfプレゼン資料
Up ai wolfプレゼン資料Up ai wolfプレゼン資料
Up ai wolfプレゼン資料
 

人狼BBSにおける発話の自動分類

Editor's Notes

  1. それでは,人狼BBSにおける発話の自動分類と題しまして, 愛知工業大学の福井敬徳が発表させていただきます 本研究は稚拙ながらも学部4年の集大成として行った卒業研究です. 数多くの課題を残したままではありますが,忌憚のないご意見をお願いします.
  2. 今日の発表の概要はこのような順序で喋らせて頂きます、宜しくお願いします。
  3. まず初めに,研究の背景として人狼ゲームと人狼知能プロジェクト,研究対象とする人狼BBSについて説明します
  4. 一般的に,人狼ゲームとは,プレイヤ同士が顔を合わせて話すコミュニケーションゲームです. 村人役と人狼役の2つの陣営に分かれ,話し合いによって,他のプレイヤの正体を探りつつ,村人と人狼は互いの排除を目指します.
  5. また,人狼ゲームを人工知能にプレイさせることを目的として立ち上がった人狼プロジェクトがあります. 人狼知能プロジェクトでは,人狼ゲームでプレイヤの代わりとなってゲームをプレイする人狼知能エージェントの開発環境を提供しています. また,人狼知能エージェント同士の強さを競う人狼知能大会を毎年開催しています.
  6. 本研究で対象とする人狼BBSを説明します. 人狼BBSとは人狼ゲームをベースにしたインターネットゲームです. 人狼BBSでは様々なプレイヤが参加しています.不特定多数が参加するため,偏りのないデータが取得できると期待できます.
  7. 人狼BBSでは文字列でのみ会話をしています.このため,表情や仕草などの情報がなく,計算機上で扱いやすいという特徴があります.
  8. また,現時点では1700以上のゲームログが存在し,人狼ゲームの記録として利用が可能です. この3つの特徴のある人狼BBSを研究の対象とします.
  9. 次に本研究の目的と問題点を挙げます
  10. 最終目的は人狼BBSに参加可能な人狼エージェントの構築です. この実現のためには大きく3ステップあると考えます, 一つ目はゲームの状況確認,言語理解, 2つ目は状況に応じた発話の決定, 3つ目は発話の生成です, [ENTER] 本研究では人狼エージェントの構築を指針として,ゲーム状況の確認,言語理解に焦点をあて,研究目的とします
  11. 先ほど示した3つのステップを図に示します. 人狼BBSの内容を言語理解し,状況を把握します 次に,状況に応じた発話の決定を行い, 最後に発話を生成し,人狼BBSで会話をします. 人狼BBSの内容を理解し,状況を把握するためには様々な問題があります. そのうちの一つに多種多様な発話が存在するため解析が困難であることが挙げられます.
  12. 多種多様な会話とは 例えば,場の雰囲気づくりのためのロールプレイ, そのBBSでのみ使われる慣例や,略語を用いた会話などです. また,ネット掲示板でよく見られる不完全な文や,記号が多いことが言語解析の妨げになります. この図では,上の4行は場の雰囲気づくりのための文です.また,白は人間であることを,黒は人狼であることを比喩しており,人狼BBSによく見られる略語の一つです. さらに,ゲーム進行に重要な発言は墨かっこで括られるという慣習があります. このように,一般的な会話や新聞の記事のような正しい日本語のみではない文を解析することが困難であることが,本研究における問題点です.
  13. 多種多様な会話を理解するための提案手法を紹介します.
  14. 本研究では大まかな内容の分類,つまり話題分類を行うことで言語理解の一段階とします. この話題分類を行うことで,大まかなゲームの進行状況を追うことが期待できます.
  15. 分類する話題は次の5つです. この話題は人狼知能プロジェクトの人狼知能エージェントプロトコルを参考に決定しました. comingoutは自分の役職の公開または限定の話題. 役職の限定というのは,「私は占い師ではありません」と言った発言です. 占い師ではないですが,他の役職である可能性,例えば,霊能者であるか,ないのかは明言を避けたままです. divined_inquestedは占いの結果または霊能の結果の発言です. 「彼は人間でした.」と言った発言がこの話題に分類されます. guardは誰を護衛したのかを報告する発言です. 「誰々を守った」「誰々を護衛した」と言った発言がこの話題に分類されます voteは誰に投票をしているかを公開する発言です. 「私は誰々に投票します」などの発言がこの話題に分類されます. 最後にEstimate は他のプレイヤの役職の予想を示す発言です. 「彼は人狼だと思う」「彼は狩人っぽい」などの発言がこの話題に分類されます.
  16. 分類には機械学習の一つであるサポートベクターマシンを用います. サポートベクターマシンとは,与えられた値を2つに分割する学習機です 人狼BBSから抽出したデータを学習し,ある特定の話題を示している発話か,ある特定の話題を示していない発話かの分類の自動化を実現します. ここで,その話題を示している場合を正例 その話題を示していない場合を負例と呼びます
  17. このように,サポートベクターマシンによる正例か負例かを分ける,2値分類を5つの話題それぞれで行います.
  18. 本研究ではサポートベクターマシンに必要な標本データを用意しました. 標本データは人狼BBSの発話内容を収集,加工したものです [ENTER] その標本データを機械学習させることによってサポートベクターマシンの自動分類を実現します
  19. それでは,標本データの作成手順を示します
  20. 私たちは機械学習のための標本データとして人狼BBSから10ゲームのログを利用しました. BBSから標本データにするために3つのステップがあります. ステップ1では文章を文を区切ります ステップ2では不必要なデータをフィルタリングします ステップ3ではラベリングをします それぞれのステップについて詳しく説明します.
  21. ステップ1では文章を1文に分解します. 人狼BBS では,一度の発言で200文字までの文章を書くことができます. この文章内には,自分自身の役職を公開するcomingoutや,相手の印象を発言するEstimateなど複数の話題が含まれるため,このまま,分類対象とするには大きすぎます. そこで,文章を句読点などの特定のシンボルをもとに機械的に1文に分解しました.
  22. 次に明らかに5つの話題に含まれない文をフィルタします. ここで,5つのどの話題にも分類されない文をuntagと呼ぶことにします. 人狼BBSでの多くの文はuntagに分類されるため,このフィルタリングで多くの解析不要な文を減らします. このフィルタリングでは,文章中にフィルター情報にある単語が含まれているかを確認します. このフィルター情報は5つのトピックに分類される可能性のある文を取りこぼさないように設定しました. このフィルタをとおった文のみ次のステップに移ります.
  23. フィルタリングされた文に対して,正例として5つの分類される話題名,または,負例としてuntagをラベリングします. 標本データは分類される一文と,分類するタグのついのデータ群です. 私たちは人狼BBSの10試合からこのサンプルデータを収集しました。
  24. The table shows the number of sample data. 作成された標本データ数を表に示します. [ENTER] 10ゲーム中で話される話題の数には偏りがあるため,標本データ数も話題ごとにばらつきがあります. [ENTER] 役職に関係なく話される話題は多くの標本データを集めることができました. 最も多いデータ数の話題は投票先の宣言,最も少ないデータ数の話題は護衛の報告でした. [ENTER] 護衛の報告は,人狼からの襲撃を阻止する役職しか発言しない上に,人狼側から狙われやすいため発言機会がとても少ない話題です.
  25. それでは実験に移ります まず,サポートベクターマシンに学習させるために標本データの前処理をし,検証手法であるk分割交差検証について説明します.
  26. 作成した標本データは正例のデータ数と負例のデータ数が異なる不均衡データです. このまま学習させると負例に偏って学習してしまうため,正例数と負例数を一致させる必要があります. 本研究では,数の多い負例を等間隔で間引くことによって不均衡データを解消しました.
  27. また,標本データは文字列のためそのままではサポートベクターマシンに学習できません, 何らかのルールによってベクトル化する必要があります. 本研究では,形態素解析エンジンであるMeCabを用いて単語に分解し, その単語の出現回数をカウントすることでベクトル化をしました
  28. サポートベクターマシンを用いて作成した分類モデルの精度をK交差検証で検証した k-分割交差検証とは,Kの数だけ標本データを分割し,そのうちの一つをテストデータ,残るデータをトレーニングデータとする検証方法である. トレーニングデータを学習させ,テストデータで学習済みSVMが正しく分類されたかをK回測る
  29. [11’40]
  30. サポートベクターマシンに5つの話題を学習せ,交差検証で精度を求めた結果を示します. この結果からComingoutとDivined_Inquestedは高い制度を得ることができました. この二つの話題は,他の話題に比べ,シンプルな構文であり,かつ,短い文でした
  31. この中で分類に失敗した文を示します. Comingoutの分類で誤って分類された例としては「この国で最初に...」や「おかんってば...」の文です. 「この国で...」の文は話題としてはカミングアウトですが,役職について述べているわけではなく,おどけた文の一つです. この文を正しく分類するためには,本研究の提案手法のみでは不十分です. 何の役職について述べているのかを解析する手段を取ることで解決すると考えます. また,「おかんってば...」の文は標本データ中での特異な文です. このように特異な文に対してはより多くの標本データを集めることや,特異な例に対して強く学習させる他の学習手法をとる必要があると考えます. 次に,Divined_Inquestedの分類で誤って分類された例としては「女は狼なんですね」が挙げれらます. この文は占いや霊能結果の報告をしているわけではなく,一つの意見を発言しています. [ENTER] このように,最後に残った人狼ーラストウルフについて考えている文になります. 本研究では一文に区切って,一文ごとに話題分類をしているため,前後文の情報を考慮していません. そのため,誤分類が生じたと考えます.
  32. もっとも分類制度の低かったGuardは誰を護衛したかを公開する発言に付与されます. この発言は狩人という役職のみが発言する話題です. 人狼BBSでは,狩人は人狼から積極的に狙われる傾向があります. そのため,狩人は護衛した情報を公開することが少なく,十分な標本データを集められなかったことが原因であると思われます.
  33. 一応、レジさん護衛してました今日の護衛先は、確定情報を落とせるレジーナさんでした【ペタ君護衛でした】今日の護衛はペーター君それは当然我輩が狩だからDA☆護衛先はリーザ2d護衛はリザ表でオットーを疑い、裏ではオットーを護衛していた2d娘3d宿4d宿
  34. 最後にまとめと今後の課題です
  35. 私たちは機械学習のアプローチとしてサポートベクターマシンを利用して,人狼BBSにある文を話題に自動分類しました. k分割交差検証を用いて評価を行なった結果から,いくつかの話題に対して私たちのアプローチが有用であることを示した.
  36. 今後の課題は多く残りましたが,特に3つについて示します. 1つ目は,より多くの標本データの作成が必要です. 明らかに標本データ数が足りないGuardはもちろん,他の話題でも十分な量の標本データ数を集められたとは言えません. 2つ目は,標本データ作成手順の改良です.フィルタリングや文の分割方法にはまだ,改良の余地があると考えています. 特にフィルタリングはフィルター情報の妥当性について定量的な検証していません.また,より良いフィルタリング方法を用いることによって分類の精度を向上できると期待できます. 3つ目はニューラルネットワークなどのような他の機械学習への適用です. 今回作成した標本データは他の機械学習にも適用できると考えています. 今後,これらの利用を検討していこうと考えています.
  37. Further discussion is required 今後の課題とさせていただきます critical problem Is just a moment please