見出し画像

横浜市立大学とprimeNumberの産学連携!2024年度のインターンシップを振り返りました

こんにちは、primeNumberです。primeNumberは横浜市立大学とデータサイエンス分野の人材育成や共同研究で連携協定を結んでいます。その一環として、学生の皆さまにPBL実習、いわゆるインターンシップを提供してきました。

今年も3週間におよぶ実習を行いました。今回は参加した学生のお二人に、その様子をまとめていただきます!primeNumberのインターンの内容はどのようなものなのか、どういった学びが得られたのか。ぜひご覧ください。


横浜市立大学からprimeNumberのソリューション本部にインターンシップとして参加したデータサイエンス学部3年生の植田と金です。

今回は3週間のインターンシップを通して取り組んだことや学んだこと、感想などをお話ししたいと思います。今回のインターンでは、primeNumberが提供するデータ基盤の総合支援サービスTROCCO®の利用データ(※)を分析し、活用促進や解約抑止に向けての改善案を考え、発表しました。


取り組んだこと

インターンの実施前には、事前学習としてTROCCO®とGoogle BigQueryやデータエンジニアリングの概論についてprimeNumberのインターンシップ受け入れ担当の方から説明を受け、SQLの勉強を行いました。

インターン本番は3週間かけて実施され、次のようなスケジュールで進んでいきました。

インターンが始まって実際のTROCCO®のデータを分析してみると、事前学習をしてきたにも関わらずデータを理解する難しさを感じました。たとえば、実務で使われているデータは多くのテーブルに分割されて管理されていますが、個々のデータ同士がどのように関係しているのかのイメージがつきませんでした。

ですが、毎日行われた朝会・夕会とインサイドセールスやカスタマーサクセスの方に対するヒアリングなどによって、データに関する不明点を解消することができました。というのも、分割されたテーブルは主キー(PK)と外部キー(FK)というもので紐づいているというデータベースにおけるテーブルの関係性の原則を学んだことに加えて、データが意味するTROCCO®のサービスやprimeNumberでの業務プロセスが理解できたからです。データの構造を把握していない段階での分析では、間違った数値を使ってしまったり、方向性が定まらなくなったりしていました。データの関連性やその意味を正しく理解することで、自分が何のために分析をするのかについてきちんと整理して、分析を効率的に進めることができるようになっていきました。

分析を終えると、分析内容からスライドを作成し発表しました。部署によってはデータ分析にそこまでなじみのない方もいるため、専門用語を書き換え、図や表を多用することでわかりやすいスライドの作成を心がけました。その結果、データ分析になじみのない方にも「分かりやすかった」と良い反応をいただけました。

ランチの時間帯に、primeNumberのさまざまな部署の方に向けて発表しました

学んだこと

今回のインターンで学んだことは、データの意味理解、適切な前処理スキル、そして円滑なコミュニケーションの3点です。

①データの意味理解

まずは、データの意味理解についてです。

前述のとおり、データ構造をしっかり理解できていない段階では、期待通りの分析を行うことはできませんでした。これは、データには数量で表せる「定量データ」と、数値では表せない「定性データ」があるからです。

大学では主に定量データの分析手法を学び、統計的な手法やデータの可視化、機械学習、ディープラーニングなどを駆使してデータから結論を導く力を養ってきました。しかし、定量的な分析だけでは、業務改善に必要な深い洞察や実践的な改善案を見出すことはできませんでした。それに対して、ヒアリングや顧客目線でのサービス利用を通じて、定性データの理解を深めることで、顧客の行動や感情を含めたより包括的な分析ができるようになりました。

業務改善を実現するためには、定量データだけでなく、主観的な要素を含む定性データも不可欠です。定性データを正しく扱うには、その背景や文脈を理解する力が求められます。今回の分析を通じて、高度な技術を駆使するだけでなく、実際の状況に即した分析がいかに重要であるかを改めて認識しました。

②適切な前処理スキル

次に、適切な前処理スキルについてです。

分析のためにさまざまなデータを扱いましたが、すぐにスムーズに活用することはできませんでした。データは、分析をするためにクレンジングをする必要があります。今回は、誤入力された値をPythonを使って特定し、正しい場所に戻したり、記入漏れにはSQLを用いて中央値で数値を補完したりするなどの処理を行いました。

このデータ以外にも、業務運用に関わるデータは、運用によってデータが整っていなかったり欠損していることがあります。分析するためにはデータに前処理をする必要があることから、データ加工の技術が重要であると感じました。具体的に必要なスキルは、分析のためにPythonのライブラリであるPandas、データ加工のためにSQLです。

③円滑なコミュニケーション

最後に、円滑なコミュニケーションです。

インターンのなかで、TROCCO®のプラン改定で一部機能が変更されたことに対して、ユーザーがどのように感じたのかをカスタマーサクセスの方に質問しました。しかし質問がうまくまとまらず、ぼんやりとした質問になってしまいました。そのため望んでいたような回答はもらえず、知っていることを再度話してもらうだけになってしまいました。

思ったような回答がいただけなかった原因として「目的を明確にできていない」「何を聞き出したいのかが整理できていない」ことがあげられると考えました。そのため次の質問では、目的は顧客の活用を促進して契約プランをアップセルしていただくことであり、そのために新プランに変更する顧客の心境が知りたいと伝えてから質問しました。

その結果、私の意図を汲み取って、分析目的に沿った回答をしていただけました。顧客への理解がより鮮明になり、分析の方向性を決めることにつながりました。

データ分析を行うためには、そのデータの内情を理解しなければなりません。データの内情は数値では理解することはできず、実際に業務に関わっている人から教えてもらうことが必要です。そのためにも、自分の知りたいことを聞き出す質問力など、円滑にコミュニケーションを行うためのスキルが求められると感じました。

感想

植田:3週間、ずっと刺激的な経験をさせていただきました。実際のデータ活用のためにはデータ分析のスキルだけではなく、前提となるスキルが数多く必要になることがよくわかりました。また、インターン中にはヒアリングに協力してくれたり、気さくに話しかけてくれたりする方が多く、非常に楽しく有意義な経験となりました。このインターンシップで学んだことを忘れずに、実務でのデータ分析の経験を積んでいきたいと思います。

金:今回はインターンシップの機会をいただき、ありがとうございました。実際のデータを用いて分析を行い、解決策を提案するという経験は大学では体験できなかったので、このインターンシップは自分にとっては挑戦でした。3週間の間、多くの試行錯誤がありました。たとえば、コードがうまく書けなかったり、処理の目的を見失い、無関係な分析をしてしまったりしたこともありました。しかし、そのたびに皆さんからたくさんのアドバイスをいただき、最終的に分析を無事に終えることができました。心より感謝申し上げます。
今後もPythonとSQLについてさらに学習を続け、データ分析の領域で生かせるようにしていきたいと考えています。


最後までお読みいただきありがとうございました!primeNumberは今後も大学との連携を通じ、「あらゆるデータを、ビジネスの力に変える」というビジョンの実現に向けて取り組んでまいります。

(※)こうしたデータを扱うに辺り、学生とは秘密保持に関する誓約書を締結し、セキュリティに十分配慮した上で分析を行っています。