「NLP」カテゴリーアーカイブ

りょうくんグルメの文体を自動でもとに戻すやつを作りました – 開け閉め

りょうくんグルメの文体を自動でもとに戻すやつを作りました - 開け閉め

りょうくんグルメの文体を自動でもとに戻すやつを作りました - 開け閉め

りょうくんグルメをご存知だろうか。知らなくても、本人のツイートの雰囲気は料理のレシピなんかで一度は見た文脈のはずだ。 こんなやつ。 まじでこの世の全てのタピオカ好きに教えてあげたいんだが新宿三丁目のceleb縁味には全ての人間を虜にする禁断のオレオミルクフォームがある。 これが濃厚黒糖で超絶美味いからぜ...

はてなブックマーク - りょうくんグルメの文体を自動でもとに戻すやつを作りました - 開け閉め はてなブックマークに追加

我偽中国語翻訳機作成了 – Qiita

我偽中国語翻訳機作成了 - Qiita

我偽中国語翻訳機作成了 - Qiita

のように、日本語の文章から偽中国語を自動生成したい。 偽中国語とは 中国語のようでいて日本人でも意味を理解できてしまう漢字の羅列のこと。 通常「私はご飯が食べたい」を中国語では 我想吃饭 と書きます。一方で偽中国語は 我飯食希望 と「私はご飯を食べることを希望する」と読めなくもない表記で記します。 これ...

はてなブックマーク - 我偽中国語翻訳機作成了 - Qiita はてなブックマークに追加

[Python]機械学習などでテキストデータを特徴量にする際のソースコード集 | かものはしの分析ブログ

[Python]機械学習などでテキストデータを特徴量にする際のソースコード集 | かものはしの分析ブログ

[Python]機械学習などでテキストデータを特徴量にする際のソースコード集 | かものはしの分析ブログ

都内の事業会社で分析やWebマーケティングの仕事をしています。大学・大学院では経済学を通じて統計解析を行うなどしておりました。企業に勤めてからは、機械学習やテキストマイニング、クローリング技術などに関心を持っています。 Twitterアカウント Mr_Sakaue( SKUE ) GitHub 読書メーター ほしいものリスト テキスト...

はてなブックマーク - [Python]機械学習などでテキストデータを特徴量にする際のソースコード集 | かものはしの分析ブログ はてなブックマークに追加

Twitter民の年収は低い 【Nuxt.js】 – Qiita

Twitter民の年収は低い 【Nuxt.js】 - Qiita

Twitter民の年収は低い 【Nuxt.js】 - Qiita

タイトルはアオリです。ツイート内容を言語処理して年代・性別・収入などを推測するアプリを簡単に作るお話です。 作ったもの Nuxt.js + Express + COTOHAのユーザ属性推定API(β)で作ったお手軽Twitter分析アプリです Google App Engineに載せて誰でも使えるようにしてます。 ↓↓↓作ったものはこちら↓↓↓ https://tweet-an...

はてなブックマーク - Twitter民の年収は低い 【Nuxt.js】 - Qiita はてなブックマークに追加

GoogleのAIとNTTのAIを融合したら最強の業務カイゼンツールが爆誕した – Qiita

GoogleのAIとNTTのAIを融合したら最強の業務カイゼンツールが爆誕した - Qiita

GoogleのAIとNTTのAIを融合したら最強の業務カイゼンツールが爆誕した - Qiita

作ったもの 紙の書類などスキャンして管理してると ↓こんな感じでファイル名がカオスになりがち… そこで、今回のツールを一発たたくとこうなります。 何となく中身が推測できるようになりました。 このツールは何? 請求書・名刺・Webページなどのpdf・画像ファイルの中身を読み取り、重要(っぽい)ワードで自動リネーム...

はてなブックマーク - GoogleのAIとNTTのAIを融合したら最強の業務カイゼンツールが爆誕した - Qiita はてなブックマークに追加

GoogleのAIとNTTのAIを融合したら最強の業務カイゼンツールが爆誕した – Qiita

GoogleのAIとNTTのAIを融合したら最強の業務カイゼンツールが爆誕した - Qiita

GoogleのAIとNTTのAIを融合したら最強の業務カイゼンツールが爆誕した - Qiita

作ったもの 紙の書類などスキャンして管理してると ↓こんな感じでファイル名がカオスになりがち… そこで、今回のツールを一発たたくとこうなります。 何となく中身が推測できるようになりました。 このツールは何? 請求書・名刺・Webページなどのpdf・画像ファイルの中身を読み取り、重要(っぽい)ワードで自動リネーム...

はてなブックマーク - GoogleのAIとNTTのAIを融合したら最強の業務カイゼンツールが爆誕した - Qiita はてなブックマークに追加

【13個掲載】機械学習に使える日本語のデータセットまとめ – Qiita

【13個掲載】機械学習に使える日本語のデータセットまとめ - Qiita

【13個掲載】機械学習に使える日本語のデータセットまとめ - Qiita

※本記事は、GengoAI発の連載記事を再編集したものです。他の機械学習に使えるオープン・データセットまとめ記事は、こちらからご覧ください。 本記事は、日本語のデータセットを紹介いたします。日本語の公開データセットを無料ダウンロードできるポータルサイトや、自然言語処理に使える日本語のテキストデータセットを...

はてなブックマーク - 【13個掲載】機械学習に使える日本語のデータセットまとめ - Qiita はてなブックマークに追加

日本語大規模SNS+Webコーパスによる単語分散表現モデルの公開 : hottoSNS-w2vの配布 | 株式会社ホットリンク

日本語大規模SNS+Webコーパスによる単語分散表現モデルの公開 : hottoSNS-w2vの配布 | 株式会社ホットリンク

日本語大規模SNS+Webコーパスによる単語分散表現モデルの公開 : hottoSNS-w2vの配布 | 株式会社ホットリンク

2019.3.4 日本語大規模SNS+Webコーパスによる単語分散表現モデルの公開 : hottoSNS-w2vの配布 2019.3.4 R&D部の榊です。 当社のR&D部では,研究開発上で利用する様々なリソースを部内で共有しています。 今回、そのうちの一つである単語分散表現モデルを社外の方にも利用可能な形で配布することにしました。 なので、そ...

はてなブックマーク - 日本語大規模SNS+Webコーパスによる単語分散表現モデルの公開 : hottoSNS-w2vの配布 | 株式会社ホットリンク はてなブックマークに追加

日本語大規模SNS+Webコーパスによる単語分散表現モデルの公開 : hottoSNS-w2vの配布 | 株式会社ホットリンク

日本語大規模SNS+Webコーパスによる単語分散表現モデルの公開 : hottoSNS-w2vの配布 | 株式会社ホットリンク

日本語大規模SNS+Webコーパスによる単語分散表現モデルの公開 : hottoSNS-w2vの配布 | 株式会社ホットリンク

2019.3.4 日本語大規模SNS+Webコーパスによる単語分散表現モデルの公開 : hottoSNS-w2vの配布 2019.3.4 R&D部の榊です。 当社のR&D部では,研究開発上で利用する様々なリソースを部内で共有しています。 今回、そのうちの一つである単語分散表現モデルを社外の方にも利用可能な形で配布することにしました。 なので、そ...

はてなブックマーク - 日本語大規模SNS+Webコーパスによる単語分散表現モデルの公開 : hottoSNS-w2vの配布 | 株式会社ホットリンク はてなブックマークに追加

日本語大規模SNS+Webコーパスによる単語分散表現モデルの公開 : hottoSNS-w2vの配布 | 株式会社ホットリンク

日本語大規模SNS+Webコーパスによる単語分散表現モデルの公開 : hottoSNS-w2vの配布 | 株式会社ホットリンク

日本語大規模SNS+Webコーパスによる単語分散表現モデルの公開 : hottoSNS-w2vの配布 | 株式会社ホットリンク

2019.3.4 日本語大規模SNS+Webコーパスによる単語分散表現モデルの公開 : hottoSNS-w2vの配布 2019.3.4 R&D部の榊です。 当社のR&D部では,研究開発上で利用する様々なリソースを部内で共有しています。 今回、そのうちの一つである単語分散表現モデルを社外の方にも利用可能な形で配布することにしました。 なので、そ...

はてなブックマーク - 日本語大規模SNS+Webコーパスによる単語分散表現モデルの公開 : hottoSNS-w2vの配布 | 株式会社ホットリンク はてなブックマークに追加

オレ プログラム ウゴカス オマエ ゲンシジン ナル – Qiita

オレ プログラム ウゴカス オマエ ゲンシジン ナル - Qiita

オレ プログラム ウゴカス オマエ ゲンシジン ナル - Qiita

ガイヨウ オレ オマエ ゲンシジンスル プログラム カイタ ゲンシジン ジョシ ツカワナイ ゲンゴショリ スル ジョシ ケス ゲンシジン カンジ ヒラガナ シラナイ ゼンブ カタカナ スル サンプル import requests import json import sys BASE_URL = "https://api.ce-cotoha.com/api/dev/nlp/" CLIENT_ID = "オマエ アイデ...

はてなブックマーク - オレ プログラム ウゴカス オマエ ゲンシジン ナル - Qiita はてなブックマークに追加

おもしろいダジャレを入力すると布団が吹っ飛ぶ装置を作った – Qiita

おもしろいダジャレを入力すると布団が吹っ飛ぶ装置を作った - Qiita

おもしろいダジャレを入力すると布団が吹っ飛ぶ装置を作った - Qiita

面白いダジャレを言うと、何が起こるでしょうか。 そうです。布団が吹っ飛びます。 今回は、ダジャレを心から愛するブレインパッドのメンバー4人が制作した、最新ダジャレAIを搭載した次世代型おもしろダジャレ検知マシン『オフトゥンフライングシステム』のご紹介をさせて頂きます。 ※補足&感謝 面白いと布団が吹っ飛...

はてなブックマーク - おもしろいダジャレを入力すると布団が吹っ飛ぶ装置を作った - Qiita はてなブックマークに追加

BERT with SentencePiece で日本語専用の pre-trained モデルを学習し、それを基にタスクを解く – クックパッド開発者ブログ

BERT with SentencePiece で日本語専用の pre-trained モデルを学習し、それを基にタスクを解く - クックパッド開発者ブログ

BERT with SentencePiece で日本語専用の pre-trained モデルを学習し、それを基にタスクを解く - クックパッド開発者ブログ

研究開発部の菊田(@yohei_kikuta)です。機械学習を活用した新規サービスの研究開発(主として画像分析系)に取り組んでいます。 最近は、社内の業務サポートを目的として、レシピを機械学習モデルで分類して Redshift に書き込む日次バッチを開発・デプロイしたりしてました。 ここ数ヶ月で読んだ論文で面白かったもの...

はてなブックマーク - BERT with SentencePiece で日本語専用の pre-trained モデルを学習し、それを基にタスクを解く - クックパッド開発者ブログ はてなブックマークに追加

汎用言語表現モデルBERTを日本語で動かす(PyTorch) – Qiita

汎用言語表現モデルBERTを日本語で動かす(PyTorch) - Qiita

汎用言語表現モデルBERTを日本語で動かす(PyTorch) - Qiita

今DL for NLP界で、BERTというモデルが話題です。PyTorchによる実装が公開されていたので、日本語Wikipediaコーパスに適用してみました。 コードはこちらに公開しております。 この記事ではBERTのポイントの解説と、ポイントごとの実装を紹介します。 尚、記事の執筆にあたってこちらのリポジトリを参考にさせていただき...

はてなブックマーク - 汎用言語表現モデルBERTを日本語で動かす(PyTorch) - Qiita はてなブックマークに追加