- 日時 :
- 2011/06/04 14:00 to 18:00
- 定員 :
- 70 人
- 会場 :
- 数理システム (東京都新宿区新宿二丁目3番10号)
- 管理者 :
toilet_lunch
- ハッシュタグ :
- #sakuTextMining
第3回 さくさくテキストマイニング勉強会
テキストマイニングについて興味がある方と一緒に、
入門レベルから始めて行けるところまで行くための勉強会を行います!
今回で3度目の開催となります。
1,2回目とは異なり会場が変わりますのでご注意下さい。
会場をお貸し下さった数理システム様、誠にありがとうございます!
前回の様子は
第2回「にこにこ」改め さくさくテキストマイニング勉強会 Ustream録画まとめ #sakutextmining
[勉強会] 第2回 さくさくテキストマイニング勉強会に参加してきた #sakuTextMining
第2回さくさくテキストマイニング勉強会に参加しました #sakuTextMining – nokunoの日記
第2回さくさくテキストマイニング勉強会で発表してきました(#sakuTextMining)
「第2回さくさくテキストマイニング勉強会」に行ってきた
Togetter – 第2回「にこにこ」改め さくさくテキストマイニング勉強会
などを御覧ください。
目的
- テキストマイニングについての学習のスタートアップ
- テキストマイニング技術に関して気軽に参加・議論することができる場の提供
概要
テキストマイニングとは、例えば製品の評判をweb上のテキストから抽出したり、
大量のアンケートテキストを分析するために用いられる技術であり、特にマーケティングの場で多くの利用例があります。
この勉強会ではそうしたテキストマイニングを題材とし、用いられている要素技術とそれに関わる課題の議論、
またテキストマイニングを実務に活かす方法について考えていきます。
詳細
| 会場 | 数理システム セミナールーム |
|---|---|
| 日付 | 2011年6月4日 (土) |
| 開場 | 13:30 |
| 開始 | 14:00 |
| 参考書(任意) | 「テキストマイニングを使う技術/作る技術」 |
会場は新宿御苑ビルの方になりますのでご注意下さい。
また会場には無線LAN環境が御座いません。ネットワーク機器などは各自お持ちください。
twitterのハッシュタグは #sakuTextMining をお使いください。
ustreamは前回もお世話になりました チームラボ の @tks さんにしていただけることになりました!
ありがとうございます!
当日は勉強会後に懇親会を行いたいと思います。
前回の懇親会では専門の技術者/研究者の方、学生の方、企業の企画の方など多彩な分野の皆様にご参加いただけました。貴重なお話が聴けるよい機会だと思いますので、お時間のある方は是非ご参加下さい。
会場受付時の諸注意
1.
当日の受付ではご来場の皆様からお名刺を頂戴致します。
お手間ですが、お名刺をお持ちの皆様はご持参の上受付のスタッフにお渡しください。
2.
受付時に懇親会の参加/不参加をお答え下さい。
懇親会費の1000円は受付で頂戴いたします。
また学生の方の懇親会参加を無料にすることにご賛同いただける方は、
1000円に+αの学生支援カンパをいただければ幸いです。
万が一会費の余剰が出た場合は次回の勉強会の懇親会費用とさせていただきます。
入門セッション
今回は本セッション開始前に、自然言語処理の基礎的な知識をご紹介する入門セッションを設けました。
「形態素解析」や「BagOfWords」など、テキストマイニングに限らない自然言語処理の基盤となる概念や用語について @AntiBayesian さんから説明していただきます。
13:40から15分程度を予定しております。テキストマイニングを専門でやっていらっしゃらない方、自然言語処理に触れたことがない方にオススメですので、気になる方は早めにご来場ください。
もちろん本セッションは14:00から開始ですので、その時間からのご参加でも問題ありません。
発表スケジュール (敬称略)
| 時間 | 発表タイトル(発表者様) |
|---|---|
| 13:40 – 13:55 | 入門セッション( AntiBayesian )(注) |
| 13:55 – 14:00 | (本セッション準備) |
| 14:00 – 14:30 | 単語重要度入門 〜テキストをダイエットさせよう〜( toilet_lunch ) |
| 14:30 – 15:00 | 特徴抽出からクラスタリング( Taka_Kuni ) |
| 15:00 – 15:10 | (休憩) |
| 15:10 – 15:40 | テキストマイニングの前のコーパス収集( gepuro ) |
| 15:40 – 16:10 | とりあえずTwitterで日本語を集めてみよう( s_wool ) |
| 16:10 – 16:20 | (休憩) |
| 16:20 – 16:50 | KH Coderで3分間テキストクッキング♪( AntiBayesian ) |
| 16:50 – 17:20 | テキスト/データマイニングと業務( tks ) |
| 17:20 – 17:30 | (休憩) |
| 17:30 – 18:00 | テキストマイニングのマーケティングへの活用について( saynoway66 ) |
(注) 入門セッションのご出席は任意となっております。
メーリングリスト
勉強会用のメーリングリストがありますので、ご登録を希望される方は
toilet.lunch@gmail.com
に「さくテキML登録希望」というタイトルの空メールを送って下さい。
メールを送ってくださったアドレスでMLに登録させていただきます。
手動なので即座に登録されるというわけではありませんが、数日中には登録致します。
連絡先
twitterid : @toilet_lunch
mail : toilet.lunch@gmail.com
発表内容の訂正
第三回さくさくテキストマイニング勉強会にてAntiBayesianが「KH Coderは4MB以上のファイルを扱うと動作が不安定になる」と申し上げましたが、
あくまでAntiBayesianの環境ではそうであるというだけの話であり、一般的にそうなると主張するものでは御座いません。
一般的に4MB以上を扱えないと誤解を与える発言であったため、訂正致します。
詳細について、KH Coder制作者から以下の通りのご連絡頂きました。ご確認下さい。
・KH Coderではどの程度の大きさのファイルまで分析できますか?
http://khc.sourceforge.net/FAQ.html#d-size
・大きなファイルの処理にはどの程度時間がかかりますか?
http://khc.sourceforge.net/FAQ.html#d-size-time
・Rによる解析結果が出ない不具合に遭遇された場合のお願い
http://koichi.nihon.to/cgi-bin/bbs_khn/khcf.cgi?no=805&reno=no&oya=805&mode=msgview
本セッションの対象者は、例えばテキストマイニングで必須の技術である「形態素解析」
という単語を全く聞いたことがないという方です。
趣旨は、各発表を聞くとき「単語を知らないから発表の内容が全然わからない」
というストレスを無くすためのものです。
「テキストマイニングの歩き方(http://www24.atpages.jp/antibayesian/up/src/up0006.pdf)」
とほぼ同じものです。
質問時間も設けますので、会場でお気軽にご質問下さい。
また、常時twitter上、@MajinMunekoでも受け付けます。
よろしくお願いします。
http://www.slideshare.net/steelwool/twitter-8211065
コメントを投稿するには、ログインしてください。