テキストアナリティクス入门ガイド
2022年1月3日
カスタマー?エクスペリエンス
顾客とのやり取りやブランドのカスタマー?エクスペリエンス(颁齿)に顾客が歓喜したり失望したりした场合、データ豊富な洞察に満ちたカスタマー?フィードバックを提供している可能性が高い。フィードバックデータは、直接的、间接的、构造化、非构造化を问わず、どこにでもあります。
アンケート调査からソーシャルメディア上のレビューまで、组织は意思决定とビジネス全体の成功を促进する顾客のシグナルを利用する机会がある。
しかし、ブランドはしばしばこの豊富なデータに苦虑する。人间のアナリストが、多种多様なチャネルにわたる何千ものフィードバックを定期的に手作业で调査することは、圧倒的である(そして事実上不可能である)。
それは、テキストアナリティクスである。テキストアナリティクスは、感情豊かなコメントを収集し、ビジネスに関连するカテゴリーに分类することで、データから洞察を引き出す。
ビッグデータにおけるテキスト分析とは?
オムニチャネルのエコシステムの中では、ブランドと顾客の间には无数のタッチポイントが存在する。毎日膨大な量のデータが生成され、しばしば呼ばれる。
テキスト分析は、非构造化テキストを构造化データに変換することで、ビッグデータから洞察を得るために使用される手法の1つである。
非构造化テキストデータを分析し理解するためには、いくつかの手順が必要である。そのため、テキスト分析には、データクレンジング、前処理、特徴抽出、)などのプロセスが含まれる。
テキスト分析とテキストマイニングの违い
テキスト分析とよく混同されるが、この2つのトピックが異なることは間違いない。テキストアナリティクスは統計学や機械学習の手法を用いてテキストデータを評価し、洞察を導き出すのに対し、テキストマイニングは非构造化データから情報を抽出する。
テキスト分析の利点
テキスト分析の人気が高まっている。多くの业界の大手ブランドは、いくつかの主要机能の1つとしてテキスト分析を提供する顾客経験管理(颁贰惭)ソフトウェアプラットフォームに投资しています。
ここでは、フィードバックプログラムを强化するテキスト分析の利点の概要を説明します:
- 少ない质问でインサイトを増やす:长时间のアンケートは、顾客がフィードバックの提供を敬远する原因になりますが、テキスト分析では、短い回答でもその言叶を深く掘り下げ、言叶の背后にある意味を明らかにします。
- 根本原因を突き止める:数値的なスコアでは、フィードバックの背后にある「理由」がわからないことがあります。しかし、テキスト分析では、详细な情报を提供することで、何がうまくいっているのか、顾客が频繁に直面する问题の根本的な原因は何なのかを特定することができます。
- タイムリーな洞察を得る:従业员にはすでに取り组むべき时间のかかるタスクのリストがあり、顾客からのフィードバックから一言一句を探るよう求めるのは非现実的です。テキストアナリティクスは、すべてのリフトを処理し、はるかに高い信頼性でそれを実现します。
- 新たなトレンドを见极める人间は、情报に基づいた贤明な意思决定を行うためにデータを必要とします。テキスト分析は、顾客が使用する単语やフレーズを利用することで、ビジネスが无视できず、活用すべきトレンドにスポットライトを当てます。
- 顾客のニーズを理解する:顾客は、彼らが何を望み、何を必要とし、何を期待しているかを教えてくれる。テキスト分析は、キーワード、テーマ、センチメントを最前线に引き出します。
- データ主导の意思决定を行う顾客により良いサービスを提供するために、テキスト分析から得られる洞察が顾客経験戦略の道筋を示す。
- 顾客体験と従业员体験の向上颁齿と同様に、テキスト分析は従业员経験(EX)も向上させます。テキストアナリティクスは、従业员の努力スコア、エンゲージメント、満足度、センチメントなどの従业员データを掘り下げます。
组织が収集するフィードバックの量が増えるにつれ、テキスト分析はそれに対応する唯一の选択肢となる。
基本的なテキスト分析
テキスト分析は、基本的なものから高度なものまで様々である。あなたが得る洞察のタイプは、あなたが使用するタイプによって异なります。
基本的なレベルでは、テキスト分析には以下のことが含まれる。
単语频度分析
単语频度分析では、テキスト中の単語を数えます。このアプローチを使用すると、テキストの最も人気のある用語やトピックを見つけることができます。
フレーズ検出
特定の単语を使用することはもちろん、センチメントやその他の重要な要素に大きく影响する、オーディエンスが使用するフレーズがあります。フレーズ検出を使えば、テキスト中の频出フレーズを见つけ、テーマを特定することができます。
センチメント分析
表面的なレベルでは、文脉がわからなければ言叶は误解を招きかねない。正しい视点を得る一つの方法は、関连する感情を判断することである。そこでセンチメント分析が活跃する。テキストの感情を判断することで、発展分野を特定することができます。
トピックモデリング
単语、フレーズ、感情が繰り返される场合、そこには根底にあるテーマが寄与している。トピック?モデリングは、文章のテーマを特定し、文章の主要なアイデアを特定するのに役立ちます。
高度なテキスト分析
公司の规模や性质によっては、基本的なテキスト分析では十分な洞察が得られない场合があります。高度なテキスト分析が必要になるかもしれません。
名前付きエンティティ认识
名前付きエンティティ认识(NER)は、テキスト中の人物、組織、場所を識別し、分類する。さらに、この方法は、テキストのエンティティのつながりを識別するのに役立つ。
テキストの分类
テキストの分类には、テキストをさまざまなカテゴリーに分類することが含まれる。膨大なテキストデータの整理を助けるとともに、この方法はパターンを見つける。
クラスタリング
非构造化データのパターンを特定するもう一つの方法は、クラスタリングである。この方法は、内容に応じてテキストをグループ化し、パターンの特定を容易にする。
関係抽出
あまりないケースですが、消费者の中には亲密な関係を持っている人もいるかもしれません。リレーションシップの抽出により、人、组织、场所がテキスト上でどのように関连しているかを判断することができます。このような洞察は、彼らの会话にコンテキストを追加し、それに応じて行动できるようにします。
ネットワーク分析
関係を超えて、共通のリンクを持つ特定のグループがあることに気づくだろう。ネットワーク分析では、テキストのリンクを调べ、物事の相互作用を説明するのに役立つパターンや倾向を见つけます。
テキスト分析のテクニックと応用
テキスト分析には、构造化されていないテキストベースのデータを分析するためのさまざまなテクニックが含まれます。トピック分析やセンチメント分析の他にも、企業がテキストデータから洞察を得るために使用できるテクニックがいくつかあります。
テキスト分析のテクニックとアプリケーションをおさらいしよう。
トピック分析
トピック分析は、顧客のフィードバック内のフレーズをビジネスに関連するトピックに分類する。例えば、"the sales associate was nice "は、"Staff Friendliness . "の下に分類される。これを達成するには、一般的に2つの方法がある:手動設定、ルールベースのアプローチ、機械学習技術。
アナリストや言語学者は、ルールベース手法のルールを手作業で構築する。例えば、"friendly "と "employee "のような2つの単語を含む節は、"Staff Friendliness "の主題の下に置かれるかもしれない。
このようなルールは语顺や重要な単语の文法的関係も评価することができる。设定手顺には时间がかかるが、各ルールが个别に构筑されるため、分类されたコメントは正确である。
教师あり分类とクラスタリングを使用する机械学习も、トピック分析の重要な要素である。そのため、アナリストは教师あり分类のためにコメントのサンプルに手作业で主题を割り当てる。そこから、注釈付きデータセットが分类器を训练し、新鲜なコメントに自动的にタグ付けする。
データにアノテーションを付けるのはルールを开発するよりも简単だが、分类器は10个以下の被写体でしか动作しない。
センチメント分析
センチメント分析では、フレーズを肯定的または否定的な感情としてタグ付けする。「贩売员がとても亲切だった」は肯定的とタグ付けされる。
辞书ベースのセンチメント分析はセットアップが简単です。辞书からすべての単语を抜き出し、各単语に肯定的または否定的なセンチメントを割り当てるのと似ている。しかし、単语のセンチメントは文脉によって変化する。
普通、汚い言叶というのはネガティブな感情を伝えるものだと思うだろうが、例えばゲームコミュニティでは、もっとファジーかもしれない。肯定的な言叶は皮肉を込めて使われることが多いし、否定的な言叶も文脉を考えれば実は肯定的な感情を持っている。
コンテキストを可能にするために、教师あり机械学习テクニックは、センチメントを割り当てるより良い方法を提供します。トピック分析のために説明された教师あり分类と同様に、センチメント分析のための教师あり机械学习は、あなたが兴味を持っているコンテキストの句のサンプルセットを取り、手动で各句に肯定的または否定的なセンチメントを割り当てることを含みます。この注釈付きデータセットから、アルゴリズムはコメントのサンプルから学习した内容に基づいて、新しい文节にセンチメントを割り当てることができます。
名前付きエンティティ认识
名前付きエンティティ认识(NER)は、非构造化テキストデータから人物、組織、場所を抽出する。NERは消費者のフィードバックやソーシャルメディアデータから影響力のある人物や組織を検出することができる。さらに、NERはテキストのテーマやトピックも認識できる。
品词タグ付け
テキスト分析では、品词(笔翱厂)タグ付けを使ってフレーズ内の各単语を分类する。この方法は、文法の分析や文献の理解に役立つ。
依存関係の解析
テキスト分析における係り受け解析は、企業が文章や文法的なつながりを発见するのに役立ちます。さらに、この方法は文の構造を分析し、内容を理解するのに役立ちます。
テキストの分类
テキスト分类は、コンテンツを使ってテキストをあらかじめ决められたカテゴリーに分类する。この方法は、消费者の声やソーシャルメディアで人気のあるテーマを特定するのに役立つ。さらに、テキスト分类は重要なアイデアを明らかにすることもできる。
テキスト分析の方法
テキスト分析は、データ収集、データ処理、テキスト分析、视覚化で构成される。
各ステップがどのように机能するか、もう少し详しく説明しよう。
#1.データ収集
テキスト分析は、ソーシャルメディア、消费者のフィードバックフォーム、オンラインレビューからのデータから始まります。データが贵社のビジネス课题に関连していることを确认してください。
#2.データ処理
データ収集に続いて行われるのが、データの処理、クリーニング、分析のための準備である。データ処理では、余計なものを削除し、フォーマットし、分析のために非构造化データを构造化する。
#3.テキスト分析
データを処理した后は、それを分析して洞察を引き出す必要があります。これには、センチメント分析、トピック?モデリング、名前付きエンティティ识别が含まれる。
#4.视覚化
最后に、テキスト分析から得られた知见をステークホルダーに示す必要がある。これは、ワードクラウド、棒グラフ、ヒートマップで実现できる。
テキストデータを分析用に準备する方法
テキスト分析用にデータを準备することで、信頼性が高く、理解しやすい结果が得られます。
ここでは、分析のためにテキストデータを準备する方法を説明する。
#1.クリーンデータ
テキストデータは、贬罢惭尝要素、鲍搁尝、特殊文字を除去することでクリーニングされる。これにより、分析用のデータがきれいに整理されます。
#2.テキストの前処理
テキストの前処理は、テキストデータを分析可能な形式に変换する。数字、句読点、小文字のテキストを削除する。
#3.テキストをトークン化する
トークン化はテキストを単语やフレーズに分割する。そうすることで、テキストデータの分析が容易になる。
#4.ストップワードを取り除く
ストップワード除去は、"and"、"the"、"is "のような頻出語をテキストから除去する。これらの単語は分析を歪める可能性がある。
#5.ステミングとレマタイゼーションでデータを简素化する
ステミングとレマタイゼーションは、単语の语根形成を伴う。これにより、テキストデータを简素化し、分析することができる。ステミングは単语から接尾辞を取り除くことであり、レマタイゼーションは接尾辞を减らすことである。
テキスト分析のよりスマートなアプローチ
テキスト分析は、その机能と利点を初めて探るとき、通常、外国の复雑な概念のように感じられます。しかし、テキスト分析の基本はご理解いただけたはずです。次のステップは、専门知识を备えたソフトウェアプロバイダーと提携することです。
惭别诲补濒濒颈补人工知能(础滨)と自然言语処理(狈尝笔)を活用し、新たなトレンドと洞察を迅速に特定します。 人工知能(础滨)とを使用して、新たなトレンドと重要な洞察を迅速に特定します。また、10年以上前にネイティブのテキスト分析の构筑を开始したため、最も包括的で、接続性が高く、アクセスしやすいテキスト分析が可能です。