メニュー 閉じる

データサイエンスが人間中心であるべき理由とおすすめの講座

皆さんこんにちは。日本でもデータサイエンスが定着していると実感しています。
あらゆるデータが活用され、人々の生活の質向上やビジネス成長に貢献しています。

そのような中でデータサイエンティストやデータ分析エンジニアの役割も増しています。

皆さんは何を思ってデータサイエンスに興味を持ちましたか?
データサイエンスとは「データを用いて科学的手法で有益な知見を引き出す方法」です。

人間の役に立つ必要があるという意味においてエンジニアリング(工学)であり、
プログラミングが「ITを用いて役立つシステムを作る方法」を指しているのだとすれば、
データサイエンスもプログラミングと同じように、究極的に「有益」を目指している分野になります。

この件については以前も別の記事にしたことがあります。

人間と深く関わる分野には文系も理系も必要

だからこそ、やっぱりデータサイエンスが人間中心でなければならないのです。
人間が悩んだり、困ったりしていること、これを解決することが、
エンジニアリングのその根本にある理念であって、目的です。それを忘れてはいけません。

 

コードが書けても良いデータは分析できない

よくある間違いに「データサイエンティストになるためデータサイエンスを勉強する」ということがあります。

確かにデータサイエンスにはよくPythonが使われるとか、ベイズ統計学が使われるとか、
ニューラルネットワークとか、クラスタリングとか、可視化の技術とかそういう技術が使われる。
これ自体は事実ですし、最先端のデータサイエンティストが使っている技術です。

最初から例えば「KKN(k近傍法)」を勉強するということどれだけ意味があるかと問われると、
なんとなく、すごそうではありますし、
たしかに知識としては必要ではあるものの絶対に知ってないといけないわけではありません。

「どうしたら効果的にデータサイエンスが身につくの?」という疑問がありますが、
そう焦る前にまずデータサイエンスの定義を意識しておく必要があります。

先程、データサイエンスは何らかの有益な知見を引き出すための技術であると紹介しました。
すると一番最初に考えるべきは、
「どういう価値を出すために、そのデータを扱いたいの?」という点です。
これは、KKNの知識があったりjupyterでPythonコードが書けるということではありません。

もちろん、データを前にしたときにどう料理するかという当たりをつけるために、
データサイエンスに関する知識が必要ですから勉強する意味はあります。
(勉強しない言い訳をする人もいるので念の為)

それでも、最初に強く意識しておくべきことは、決して技術を知ることではなく、
「データサイエンティストを目指す前に、どういう結論を導けたら成功だと考えるのか」でしょう。
それは人によって異なるはずです。

 

データサイエンティストになる前に人に興味をもつ

実は本当に見つけたいことは、必ずしも金銭的対価を得られる「仕事」であるとは限りません。

それは、例えば裏山に仕掛けたIoTの連続的な気象データを分析することで、
地域の環境変化に真っ先に気づくことができたり、
酒屋さんを営む父の店の購買データを分析することで、
常連さんの好みを推定して喜ばれるようなことかもしれません。

こうした問いを持たずに闇雲にデータ分析を行ったりすることも意味がないわけではないですが、
こればかり伸ばしてもデータサイエンティストとしての分析視点は現実問題と乖離し続けるでしょう。

根本的に自分が「どうしたいのか?」「そういう価値が出せたら良いのか?」があること。
これは自分の人生の選択、すべての取り組みに対する前提になっています。

普段仕事をしていると、なんとなくデータが与えられているからこそ、
それをいろいろこねくり回して何らかの結論を導き出したい衝動に駆られます。
仕事においてはそれで十分であって、任せられた仕事の中で何かしら成果を出せばOKかもしれません。

しかし、本当に解決すべき問題はデータ自体も与えられるものではないことです。
そして金銭的にメリットがあるとは限りません。
対価が支払われないなかでも自分がモチベートできる課題を見つけることができるか。

これは誰にもできることではありませんが、取り組みたい問題を見つけることが大切ということです。
その意味においてデータサイエンティストはまず、人間や社会に強い関心があるべきだと思います。

冒頭でも少し触れているように、「エンジニア」を目指す人にも言っていることですが、
日本でエンジニアリングという言葉は工学と訳されました。
これは「現実の課題を解決する役に立つ技術」を指しています。

役に立つことというと「人から仕事として依頼される」場合もありますが、
実はそれは小さい意味においてであって、
根本は「自分が役に立っていると感じられることを技術ですること」です。
その使い方の手法が強化学習だったりするわけでそれ自体に本質的な意味はありません。

もし、今そんな思いが微塵もないというのであれば少し頭に置いておくだけでいいのですが、
とりあえず手を動かしてみながら考えてみたときに、
自分が取り組みたいデータサイエンスが少しずつ見えてくることを願っています。

 

Udemyのデータサイエンスや機械学習講座を受ける

知識・技術レベルでのデータサイエンスの手法を身につける方法をご紹介します。
まず、おすすめの学習サイトは「Udemy」です。
Udemyはオンラインの学習サイトで、色々な講師の様々な分野の講座が開かれています。

プログラミングに関するものから経営やファイナンスなどビジネスに役立つ講座が多い印象です。
英語が得意であれば他にもedXやCorseraをおすすめしているのですが、
人気の日本人講師が丁寧に教えてくれるという点においてUdemyよりよいサイトはありません。

なぜこのようなUdemyのような有料の講座をおすすめするのかというと理由は2つ、

  1. 初心者にありがちなつまづきポイントが潰されている
  2. Udemyは定期的にセールを実施しているので2千円あれば受講できる

1に関しては環境構築やデータ分析のためのデータそのものについてもつまずかないよう、
講師が十分に検討して解説しているので、無料のものやブログ等を見ながらやるよりはつまずきにくいです。

また2に関してはUdemy特有のセールが定期的に実施されています。
このタイミングは1ヶ月に1回程度と高頻度なので人気の講座を2千円程度で購入できます。
セミナーに参加するより十分に安く、そして効率的かつ効果的です。

 

おすすめのデータサイエンス・機械学習講座

【世界で34万人が受講】データサイエンティストを目指すあなたへ〜データサイエンス25時間ブートキャンプ〜
https://www.udemy.com/share/102FVo/

みんなのAI講座 ゼロからPythonで学ぶ人工知能と機械学習 【2020年最新版】
https://www.udemy.com/course/learning-ai/

以前、統計局のデータサイエンス入門講座を受講し修了しましたので、
こちらも記事にしたことがあります。

統計局の社会人のためのデータサイエンス入門を受講してみた【Week1】

平均から先がわからない人のための統計学【社会人のためのデータサイエンス入門Week2】

もっと知りたい共分散と回帰分析【社会人のためのデータサイエンス入門Week2】

比率と時系列データを賢く使え!【社会人のためのデータサイエンス入門Week3】

 

ココロファンではMOOCs手当を支給しています!

弊社では代表自らが「こうあったらいいな」と思っていた会社からの学習支援を実現しています。

今回紹介したようなデータサイエンス・機械学習講座が配信されている、
UdemyやCoursera、edXなどのMOOCs(Massive Open Online Courses)の受講料について、
社員全員を対象にコース終了後に受講料を基本的に全額(US300ドルまで)負担します。

これは宣伝ではありますが、学びたいエンジニア・データサイエンティストにおすすめの福利厚生です!

Cocolofun University