九州大学 研究者情報
発表一覧
鈴木 孝彦(すずきたかひこ) データ更新日:2020.04.03

准教授 /  情報基盤研究開発センター 応用データ科学研究部門


学会発表等
1. Takahiko Suzuki Tsukasa Kamimasu Tetsuya Nakatoh Sachio Hirokawa, Identification of Unnatural Subsets in Statistical Data, ESKM 2018 (IIAI AAI 2018), 2018.07, Benford’s law is an observation on the frequency distribution of first significant digits in natural numerical data. We can measure the unnaturalness of the data by evaluating estrangementofthefrequencydistributionofleadingdigitsofthe datainrelationtotheBenford’sdistribution.However,wecannot identify the unnatural part of the data precisely. In this study, we focus on the fact that statistical data is generally provided in tabular form. We specify a subset of the target data by using the item names of rows and columns that define each cell of the table or words appearing in the table title. By measuring the degree of divergence of the subset from Benford’s distribution, we can identify unnatural subsets. We apply this method to agriculturerelated data from China Statistical Yearbook and succeeded to identify unnatural subsets..
2. #草刈祐子 鈴木孝彦 廣川佐千男, 有用な商品レビュー抽出のための過賞賛レビュー除去フィルターの性能評価, MPS 研究会, 2018.12, 概要:オンラインショップで買い物をする際, 商品につけられているレビューは購入判断の重要な要素になる. しかし, これらのレビューの中には手放しで商品を褒める客観性のないレビューや, やらせのレビューなどの役に立たないレビューも多く存在する. それらのレビューは購入判断の妨げになる. 我々は, それらの役に立たないレビューを除外するフィルターを作成し, 性能を評価した. フィルターの作成にあたり, 商品に対するレビューの評価分布から, 過賞賛レビューを抽出した. 最高評価レビューが一定以上の割合で投稿されている商品に着目した. .
3. 草刈祐子 鈴木孝彦 廣川佐千男, 過賞賛のレビューの検出と特徴語抽出, Fit シンポジウム, 2018.09, オンラインショップでの商品購入においてその商品のレビューを参考にすることは多々ある。
しかし、それらのレビューには有益な情報がなくただ商品を褒めているだけのものが多く含まれる。
そのようなレビューをスパムフィルターのような仕組みで除外できればオンラインショップのユーザーにとって有益である。
本稿では、楽天市場の商品レビューデータについて、最高評価のレビューばかりが大量に投稿されている商品に注目する。
そのような商品に対する最高評価レビューを『有益な情報がなくただ商品を褒めているだけのレビュー』とみなし、
SVMを用いた機械学習による判別および特徴語の抽出を試みた。.
4. 草刈祐子、鈴木孝彦、廣川佐千男, 有用なレビューの特徴抽出, 火の国シンポジウム, 2018.03.
5. 鈴木孝彦、上枡司、廣川佐千男, 統計数値における不整合部分検出の試み, 情報・統計科学シンポジウム, 2017.10, 近年、大量のデータが流通し、データに基づいて様々な判断が行われている。流通するデータが信頼にたる物であるかについてしばしば疑念が示されている。データの特性に応じて信頼性をチェックする様々な方法が提供されているが、疑念を解消するにはいたっていない。
本発表では中国統計年鑑の数値データの信頼性について、Benford の法則を用いて検証を行った。.
6. 鈴木 孝彦, 廣川 佐千男, 相場 亮, 割石 直, 野口 和久, 対話的文脈可視化システム, 電子情報通信学会, 2016.12, 万葉集は現存する日本最古の歌集である。万葉集には7 世紀から8 世紀にかけて詠まれた約4500 首の
和歌が収められている。一方、日本最初の勅撰和歌集として古今和歌集が存在する。 古今和歌集は905 年に成立し
たとされており、約1100 首が収められている。万葉集・古今和歌集に関する研究は多くあり、その中で万葉集・
古今和歌集の歌風の違いなどが指摘されている。本稿ではこのように異なる歌風を持った2つの歌集について季節
に関わる単語に着目し、それらが使われている文脈を可視化して比較を行った。.
7. 鈴木 孝彦, 廣川 佐千男, 野口 和久, 割石 直, 同義語に着目した日報からの営業成績推定, 電子情報通信学会, 2016.12, 営業活動の評価と改善は重要な企業活動である。著者らは営業日報の分析が営業活動の改善に有用と考え、SVM(support vector machine)を適用し、優秀な営業員と そうでない営業員の識別を行ってきた。これまでの研究で、少数の単語で高い 識別性能が得られることがわかっている。著者らは、好成績の営業員は「成功」 という語を使い、そうでない営業員はその同義語の「達成」を使うという傾向を発見した。本稿では、同義語の使い方の違いのみで、好成績の営業員が識別可能かという問題に対する定量的評価を行った。
具体的には、「成功」のように、成績が反対の営業員の特徴語にその同義語 (達成)が現れる単語(極性乖離語を呼ぶ)に着目した。売上額上位の営業員 と売上額下位の営業員の識別問題に対し、100個の極性乖離語のみを使って、8割の識別ができることを確認できた。
.
8. 鈴木 孝彦, 宮田 光樹, 廣川 佐千男, WSD における単語の曖昧性と難易度との関係, 電子情報通信学会 , 2015.02, 言語学習において、新たな単語を学ぶ際の問題として、その単語が日常的に使われる単語かどうかという難易度がある。また、単語の多義性からくる曖昧さの問題がある。以前、我々はWordNetのSynsetの静的な構造に基づいて、単語の曖昧性を定義し、難易度との関係を調べた。本稿では、WSD(Word Sense Disambiguation)システムを用いて、文中での単語用例の動的な曖昧性を調べ、難易度との関係を議論する。.
9. 鈴木 孝彦, 廣川 佐千男, 宮田 光樹, 平尾 拓也, 意味辞書WordNetの不整合抽出, 電気情報通信学会, 2014.03, 意味辞書である日本語WordNetは,自然言語処理に有用である.しかしながら,日本語WordNet中には5%ほどのミスが存在している(公式発表).本稿では,日本語WordNetのミスを分類し,それらを機械的に抽出する方法について論ずる..
10. 鈴木 孝彦, 廣川 佐千男, 平尾 拓也, 宮田 光樹, 日本語WordNet類義語の誤り検出 -コーパス利用の試み-
, 電子情報通信学会, 2014.11, 日本語WordNetは自然言語処理において有用なツールであるが、5%の間違いが存在すると公式に認められている。結果として、言語処理のデータベースとして信頼性の面に疑問が残る。本論文では、日本語WordNet内の間違いを抽出するいくつかの手法を提示する。
前半では日本語WordNetそれ単体のみを使用した手法を提示し、その結果を記述する。後半では日本語WordNetと、外部より準備したコーパスを使用し、構造上の間違いを抽出する手法を提示する。
.
11. 廣川佐千男,中藤哲也,殷成久,鈴木孝彦,橋本喜代太, 料理とスイーツにおけるオノマトペの違いの分析, 人工知能学会, 2012.06.
12. 鈴木 孝彦, 宮田光樹, 廣川 佐千男, 動詞の難易度と多義性について-日本語WordNet上のSynset に基づく分析-, 2013.09, 外国語学習者が、新しい単語を学ぶときに直面する問題として,その単語が日常的な使われるか単語かどうかという難易度がある.また,同じ単語でも,使われる状況で意味が異なるという、意味の曖昧性と多義性の問題がある.同じ単語でも,文脈が異なれば,違う意味として解釈しなければならない.本論文では,日本語を対象として,単語の難易度と曖昧さの関係を分析した.単語の難易度としては,日本語能力試験(JLPT)における単語レベル(旧版)を用いた.単語の曖昧さとして,WordNetのSynset構造を用いた3種類の尺度を新たに提案した.その結果,動詞については,難易度の低い単語ほど多義性が高いという予想外の関係が明らかになった..
13. 鈴木 孝彦, 宮田光樹, 廣川 佐千男, 動詞の意味の曖昧性についての考察, 2013.02, 概念辞書WordNet の動詞には、複数の意味(曖昧性)を持つものが多い。この曖昧性を定量化し、語の難しさとどのよ
うな関連があるかを調べた。語の難しさの指標として、日本語能力試験(JLPT)の出題想定レベルを用いて分析した結
果、難易度の高い動詞の方が難易度の低い動詞より曖昧性が低いことが分かった。また、文中の動詞の出現について
の動詞の曖昧性解消にWordNet を利用する方法を提案し、単語の難易度と曖昧性解消性能の関係について考察した。.

九大関連コンテンツ

pure2017年10月2日から、「九州大学研究者情報」を補完するデータベースとして、Elsevier社の「Pure」による研究業績の公開を開始しました。
 
 
九州大学知的財産本部「九州大学Seeds集」