今回はデータアナリストの仕事について、そのミッションからプロセスごとの業務内容、1日の働き方まで詳しくご紹介します。データアナリストとしてのキャリアを考えている方は、ぜひご参考になさってください。
【目次】
- データアナリストの仕事概要・ミッション
- データアナリストの仕事のプロセス①:分析の企画立案
- データアナリストの仕事のプロセス②:データの収集と前処理
- データアナリストの仕事のプロセス③:データの分析、モデル構築
- データアナリストの仕事のプロセス④:結果の取りまとめ、報告
- データアナリストの1日(働き方例)
データアナリストの仕事概要・ミッション
データアナリストのミッションは、「データ分析に関する専門性を活かし、ビジネスの意思決定者に有用な示唆を提供すること」です。
データアナリストが働く会社は、コンサルティングファームの場合もあれば、事業会社の場合もあります。また得意領域も、ビジネス寄り、エンジニア寄り、またはアルゴリズムの構築に特化などデータアナリストによってさまざまです。
そのような業態や得意分野の違いはあれど、「データ分析に関する専門性を活かし、ビジネスの意思決定者に有用な示唆を提供すること」というミッションは共通しています。
データアナリストの仕事は、ビジネス課題の把握から始まり、データの前処理、分析モデルの構築、レポーティングまでをカバーします。基本的に全ての工程をこなせるようになってはじめて、データアナリストとして独り立ちした状態となります。
分析結果をもとに施策が成功し、売上向上やコスト削減が実現すれば、そのデータアナリストへの評価は高まります。
データアナリストの仕事は、以下のようなプロセスを踏んで進められます。
・データアナリストの仕事のプロセス①:分析の企画立案
・データアナリストの仕事のプロセス②:データの収集と前処理
・データアナリストの仕事のプロセス③:データの分析、モデル構築
・データアナリストの仕事のプロセス④:結果の取りまとめ、報告
それぞれのプロセスについて、以下で詳しく解説していきます。
データアナリストの仕事のプロセス①:分析の企画立案
まずは分析の企画立案から始めます。
起点にあるのは、ビジネス上の課題です。課題とは例えば、店舗の集客数が下がってしまった、Web広告の閲覧率を上げたい、新規出店したときの売上を予測したい、といったビジネスニーズです。
このような課題はビジネスサイドから相談されることもあれば、データアナリスト側から提起することもあります。まずはビジネスサイドのニーズをよくヒアリングし、課題に対してどのような分析でアプローチするべきか考えます。
ビジネスサイドと分析の方向性について合意できたら、企画書をまとめていきます。内容としては、以下のような項目を詰めていきます。
・解決するべき課題の明確化、分析の目的
・課題の解決に必要となるデータの一覧
・分析のアプローチ(分析手法や、分析環境の概要)
・アウトプットのイメージ(予測モデルやレポート構成など)
・分析の費用対効果
・チーム体制
・スケジュール
当然ながら、分析を実行するためにはコストがかかります。そのため、分析により得られるビジネスインパクト(売上の向上またはコストの削減)を試算し、費用を考慮してもリーズナブルな企画であることを示す必要があります。
そのロジックが妥当なものであればプロジェクトとして承認され、分析が始まります。
データアナリストの仕事のプロセス②:データの収集と前処理
分析の実務が始まったら、まずは企画フェーズで定義した各種データを収集します。
対象データは、直接システムから取得する場合もあれば、ビジネスサイドからAccessやExcel、CSVなどのファイル形式で受領することもあります。ビジネスサイドからデータが出てくるのに時間がかかることもあるため、事前に提供期限を合意しておきます。
必要なデータが収集できたら、分析環境のデータベースにインポートしていきます。分析環境は、AWSやAzure、GCPなどのクラウドサービスを利用することが多いです。
またこの段階では、データベース設計のスキルが必要になります。効率的なデータ処理を行うために、テーブル定義や正規化、プライマリーキーの設定などデータベースに関する知識を活かして作業を行います。
データベースが整備できたら、次にデータの前処理のプロセスに進みます。
データ分析の世界では、「前処理が8割」と言われるほど重要な工程です。なぜなら、前処理の結果によって、データ分析の品質の大部分が規定されてしまうからです。
ローデータ、つまり生の状態のデータには雑多なデータが混ざっており、そのままでは当該プロジェクトにおける分析で使えないことがほとんどです。前処理とは、そのようなローデータを分析に適した形式に加工する作業を指します。
前処理の手法にはさまざまなものがありますが、例として以下のような処理があります。
・カテゴリデータの数値変換
・欠損値の補正処理
・異常データの除去
・多重共線性を避けるための変数選択
そのままでは分析できないローデータからノイズを除去し、きれいなデータにしていくイメージです。その意味で、データの前処理は「データクリーニング」や「データクレンジング」などと言われることもあります。
このフェーズでは、特にエンジニアリング力が求められます。ツールとしてはSQLやR、Pythonなどでコードを書いて加工することが多いです。
また次のステップである分析モデルの構築フェーズで、思うように精度が出ない場合は、この前処理工程に戻ってくることもあります。工程を行き来しながら分析の精度を高めていきます。
データアナリストの仕事のプロセス③:データの分析、モデル構築
前処理が一段落したら、基礎分析とモデル構築を行います。
基礎分析
データの理解を目的として基礎分析を行います。いろいろな統計量を計算して、まずはデータの全体的な傾向をつかんでいきます。統計量とは、例えば平均値や中央値、最頻値、標準偏差、相関係数などの指標です。統計学の最も基礎的な領域である、記述統計の知識が必要となります。
またデータの理解には、散布図の作成も有効です。散布図により、変数同士が正の相関か負の相関か、あるいは無相関かといったことが把握できます。
ここで得たデータの理解をふまえて、分析のアルゴリズム選択や、モデル精度向上のためのチューニング作業を行っていきます。
分析モデルの構築
基礎分析によりデータの傾向がつかめたら、分析モデルの構築に進みます。
モデルの構築にあたっては、分析用のプログラミング言語で用意されているライブラリを使用することが多いです。統計学や機械学習に関する知識をもとに、今回分析するデータにふさわしい分析手法を選択します。分析のアルゴリズムとしては、例えば以下のようなものがあります。
・教師ありモデル:重回帰、ロジスティック回帰、決定木、ランダムフォレストなど
・教師なしモデル:クラスタリング、アソシエーション分析など
データアナリストは、各手法の仕組みや強み、どういうデータに使うとよいのかといった点を熟知している必要があります。
適切な分析手法を選定したら、データに適用してモデルを構築します。モデルにとっては、予測精度の高さが価値となります。そのためデータアナリストは、適切な変数を選択したり、パラメータをチューニングしたりするなど、この段階では精度を高めるために試行錯誤を繰り返します。
このような、分析手法の選択や精度向上のための試行錯誤はデータアナリストの仕事の核であり、熟練したスキルが求められます。
分析のためのプログラミング言語としては、PythonかRが使われることが多いです。金融機関や製薬会社などの大企業では、有償ソフトであるSASやSPSSが使われることもあります。データアナリストには、こうした分析用の言語をいくつか使いこなせることが求められます。
データアナリストの仕事のプロセス④:結果の取りまとめ、報告
分析の実作業が完了したら、結果を報告書にまとめます。資料はPowerPointにまとめることが多いです。報告書には、以下のような項目を記載していきます。
・分析の前提条件。使用したデータの期間や、前処理の概要など
・分析結果のサマリ、ビジネス課題への示唆
・基礎分析の結果詳細
・構築したモデルの詳細、使い方などの説明
分析の前提条件やサマリを整理したうえで、構築したモデルの詳細を説明します。例えば、新規出店時の売上予測であれば、出店エリアの人口や所得データ、競合店舗数などの変数をインプットすると出店時の売上予測値が出力される、その結果の信頼性はこのように検証した、といったことを記載していきます。
このような報告書とともに、モデルが搭載されたツールなどを納品して完了となります。
データアナリストの1日(働き方例)
9:00
メールチェック、その日のタスク/スケジュールを確認。
9:30
チームのデイリーミーティングに参加。前日までの分析で分かったこと、課題を共有し、マネージャーからフィードバックを得る。
10:00
データベースにアクセスして必要なデータを抽出する。SQLを駆使してさまざまなテーブルの統合や集約を行い、分析用に適したデータテーブルを作成する。
12:30
ランチ。以前はチームメンバーやビジネスサイドのメンバーと出かけることが多かったが、最近はもっぱらリモートのため自宅で食べる。
13:30
午前中に抽出したデータをPythonで分析。まずはクロス集計や可視化によりデータの傾向を理解して、本分析の方針を立てる。
16:00
マネージャーと進捗確認ミーティング。今後の分析方針を説明する。概ね考えていた方針で了承が得られたが、いくつか追加の分析項目を指示される。
16:30
マネージャーからのフィードバックも踏まえて、データ分析を続行。きりのよいところで本日の分析作業は終了。
18:00
いくつか新しい分析手法を試すことになったため、Webのコンテンツや書籍で理論を学び、翌日の作業に備える。
=================
>データアナリストへのキャリアに関する記事
データアナリストの仕事は、コンサルと事業会社でどう違うのか?
https://www.axc.ne.jp/media/careertips/dataanalyst_consuldifference
データアナリストに必要な「資格」とは?【統計スキル、ITスキル別】
https://www.axc.ne.jp/media/careertips/dataanalyst_statisticsandit
データアナリストに向いている人、向いていない人とは?それぞれの特徴を解説
https://www.axc.ne.jp/media/careertips/dataanalyst_point
=================
今回は、データアナリストの仕事について、ミッションからプロセスごとの詳細、1日の働き方まで解説しました。
データアナリストの求人をご希望の方、キャリアを考えている方は、ぜひアクシスコンサルティングにご相談ください。
アクシスの求人のうち、
約77%は非公開。
平均サポート期間は3年です。
各ファームのパートナー、事業会社のCxOに定期的にご来社いただき、新組織立ち上げ等の情報交換を行なっています。中長期でのキャリアを含め、ぜひご相談ください。