
Studio Ousia、世界最高水準のキーワード抽出エンジンSemantic KernelのAPIをリリース
グローバルコンペティションで二冠を達成した高精度のエンティティリンキングエンジンで新しいアドテクやメディア運営を提案
株式会社Studio Ousia(本社:神奈川県藤沢市、代表取締役:渡邉安弘、山田育矢)は、グローバルなコンペティションで優勝実績*1のあるキーワード抽出エンジンSemantic Kernel(セマンティック・カーネル)のAPIをリリースいたしました。
Semantic Kernelは、文章中からキーワードを正確に抽出し、同音異義語などの記述された言葉の曖昧性を解消し、分類を行います。また、文中の言葉の重要度を認識するため、用途に応じたキーワードの抽出の調整が可能です。
Semantic Kernelのベースとなっているエンティティリンキング(Entity linking)とは、テキスト中のエンティティ(人名や地名、用語、作品名など)をWikipediaやDBpediaなどのナレッジベースに一対一で結びつけて処理する自然言語処理の技術のことで、米国立標準技術研究所(NIST)や米Microsoft Researchがエンティティリンキングに関するワークショップを開催するなど、近年世界的に高い注目を集めています。
Studio Ousiaは、言語系及びWeb系の世界的権威のある国際会議(WWW2015、ACL2015)内で行われたエンティティリンキングのコンペティションで、国際的に著名な学術機関や企業等に対して、大差をつけて優勝しており、Semantic Kernelはその技術の粋を集めたエンジンです。
Semantic Kernelを活用いただけるシーンとしては、以下のものが考えられます。
アドテクノロジにおけるオーディエンスデータの抽出
eコマースやC2Cプラットフォームの検索やレコメンド機能の精度向上
オンラインメディアのタグ付けや記事リンク化、キュレーションの精度の向上
ソーシャルメディアや社内データなど非構造テキスト解析精度の向上
など
Semantic Kernel APIは、日本語と英語に対応しています。登録アカウントの作成ですぐに利用できる標準プランとカスタマイズなどを行えるプレミアムプランの二種類で、無料のトライアルもご利用いただけます。
弊社サイトより商品の詳細をご覧いただけます。
ー http://www.ousia.jp/ja/semantickernel
*1: 2015年5月にWWW2015(International World Wide Web Conference)内で行われた「エンティティリンキング」に関するコンペティションNamed Entity rEcognition and Linking (NEEL) Challenge、及び、同年7月にACL(Association for Computational Linguistics)で行われた、Noisy User-generated Text(W-NUT)の各コンペティションで優勝。
ー http://www.ousia.jp/ja/page/ja/2015/05/www2015/
ー http://www.ousia.jp/ja/page/ja/2015/08/05/acl2015/
■ 会社概要
Studio Ousiaは、 「モノ」と「情報」を適切に結びつけるプラットフォームを作る研究開発を通して、 適切な情報を提供する基盤を作ることを目指す会社です。
社名 : 株式会社Studio Ousia
所在地 : 神奈川県藤沢市遠藤4489番105 慶應藤沢イノベーションビレッジ221号室
代表 : 代表取締役 渡邉安弘 山田育矢
設立 : 2007年2月5日
資本金 : 1億1,077万円
URL : http://www.ousia.jp
- テキスト
- テキストとは、純粋に文字のみで構成されるデータのことをいいます。 太字や斜線などの修飾情報や、埋め込まれた画像などの文字以外のデータが表現することはできませんが、テキストのみで構成されたテキストファイルであれば、どのような機種のコンピューターでも共通して利用することができます。
- フォーム
- フォームとは、もともと「形」「書式」「伝票」などの意味を持つ英単語です。インターネットの分野では、パソコンの操作画面におけるユーザーからの入力を受け付ける部分を指します。企業のホームページでは、入力フォームが設置されていることが多いようです。
- オンライン
- オンラインとは、通信回線などを使ってネットワークやコンピューターに接続されている状態のことをいいます。対義語は「オフライン」(offline)です。 現在では、オンラインゲームやオンラインショップなどで、インターネットなどのネットワークに接続され、遠隔からサービスや情報などを利用できる状態のことを言う場合が多いです。
- タグ
- タグとは、原義では「モノを分類するために付ける小さな札」のことです。英語の「tag」を意味するものであり、荷札、付箋といった意味を持っています。特にインターネットに関する用語としてのタグは、本文以外の情報を付与するときに用いられます。
- リンク
- リンクとは、インターネット上では、あるページの中に記された、他のページの所在を表す情報のことを「ハイパーリンク」と呼び、これを略した言葉です。リンクのある場所をクリックすると、他のページにジャンプするようになっています。
- ソーシャルメディア
- ソーシャルメディアとは、インターネット上で不特定多数の人がコミュニケーションを取ることで、情報の共有や情報の拡散が生まれる媒体のことです。FacebookやTwitterなどのほか、ホームページ上の掲示板もこれにあたります。
- テキスト
- テキストとは、純粋に文字のみで構成されるデータのことをいいます。 太字や斜線などの修飾情報や、埋め込まれた画像などの文字以外のデータが表現することはできませんが、テキストのみで構成されたテキストファイルであれば、どのような機種のコンピューターでも共通して利用することができます。
- アカウント
- アカウントとは、コンピューターやある会員システムなどサービスを使うときに、その人を認識する最低必要な情報として、パスワードと対をなして使う、任意で決めるつづりです。ユーザー、ID、などとも言います。
- フォーム
- フォームとは、もともと「形」「書式」「伝票」などの意味を持つ英単語です。インターネットの分野では、パソコンの操作画面におけるユーザーからの入力を受け付ける部分を指します。企業のホームページでは、入力フォームが設置されていることが多いようです。
- URL
- URLとは、「Uniform Resource Locator」の略称です。情報がどこにあるのかを示すインターネット上の住所のようなものだと考えるとわかりやすいでしょう。各ページのURLは、インターネットブラウザの上部に文字列として表示されています。日本語では「統一資源位置指定子」という名称がついていますが、実際には日本でもURLという語が使われています。
おすすめ記事
おすすめエントリー
カテゴリから記事をさがす
Web マーケティング
- SEO(検索エンジン最適化)
- SNSマーケティング
- アプリマーケティング
- Web広告
- グロースハック
- ABテスト・EFO・CRO
- LP制作・LPO
- CMS・Webサイト制作
- 記事制作・ライティング
- コンテンツマーケティング
- メール配信・メールマーケティング
- マーケティングオートメーション(MA)
- リードジェネレーション(見込み顧客獲得)
- カスタマーサポート・カスタマーサクセス
- アクセス解析・広告効果測定
- データ分析
- リサーチ・市場調査
- 口コミ分析・ソーシャルリスニング
- O2O(Online to Offline)
- EC・通販・ネットショップ
- 多言語・翻訳
- 動画・映像制作
- AR・VR制作
- 統計データ
- マーケティングお役立ちレポート
- 連載
- チャットボット
- Web会議
- 動画マーケティング