Yonoseko's Working Diary

主にiPadでPythonを勉強したり、kaggleを趣味にすべく機械学習を勉強したり、ケーナの演奏をしたりする人の活動日誌です。

作業日誌2018-10-16

【やったこと】

  • CourseraのWeek4、Ensembleのアサインメントを終了してWeek4完了!

【わかったこと / 進捗があったこと】

  • numpy要復習かも。SQLを実務で使ってるのでどうしてもpandasの方が馴染みが良いんだけども、作業やライブラリによってはnumpyで加工したりするほうが楽だったり、むしろ必須だったりする。

【考えたこと】

  • Coursera、いよいよ残すところ最終課題のみ。がんばろう。

作業日誌2018-10-04

【やったこと】

  • CourseraのWeek4、Tips and tricksとAdvanced features IIを終了。
  • アンサンブル学習(Stackingまで)の動画とNotebookを視聴。各章のまとめを作った。

【わかったこと / 進捗があったこと】

  • kazAnova氏の説明がわかりやすくて涙出た。アンサンブル学習の種類別の概念を理解した。
  • 上級者向けの任意のアサインメントは難しいので一旦保留にした。
  • 上記のアサインメントを通してmultiprocessingというライブラリに出会った。関数に順番に引数を渡して実行するのに便利…という感じのようだ。もう少し他の説明や記事を読んでみないと上手には扱えないかも。

【考えたこと】

  • お勉強たのしい。
  • やはりトップランカーにもなると説明もわかりやすいんだなあ。

作業日誌2018-10-03

【やったこと】

  • CourseraのWeek4、Hyperparameter tuningのアサインメントまで完了。
  • 最終アサインメントのコードをとりあえずざっくりと書いて一度提出した!
  • 機械学習関係について、今見えている学習項目を書き出した。

【わかったこと / 進捗があったこと】

  • モデル別で実務ベースでどのパラメータからチューニングしたらよいかまとまっていたので、何を調節するべきなのかよくわかった。
  • 最終アサインメントのモデル作成の手際がTitanicの頃よりも手際が良くなった。訓練データと教師データの両方で処理すべき特徴量、訓練データのみに必要な処理、EDA、モデルの適用など一通りの流れが頭に入ってたからかなと思う。
  • 今回はほとんど初めて触る回帰モデルなので、モデルの選定や適切な特徴量処理、feature engineeringをどうしたら良いか、学習を進めたい。
    • オライリーの本の回帰の部分だけでももう一度おさらいしようかなと思った。

【考えたこと】

  • 勉強したいことを書き出したらやることがたくさん!早くキリの良いところまで進めたいという気持ちがやる気に繋がって良い感じ。

作業日誌2018-10-02

【やったこと】

  • CourseraWeek3、最後のアサインメントまで完了!

 

 【わかったこと / 進捗があったこと】

  • Coursera Week2Data LeakagesPeer reviewされるのが必要だった課題にレビューが付いた。通過した!嬉しい!
  • 自分がPeer reviewするものも達成し、Week2が完了。他の人の書きっぷりから理解が深まる。
  • Mean Encodingは便利そうだ。
  • pandasmaptransformの良い練習になった。transform初めてだったけどこれ便利な関数ですね。

 

【考えたこと】

  • 動画を見た後にクイズをきちんとこなすと、わからなかったこともわかるし、ふわっとしか理解してなかったことがわかって良い感じ。
  • 「今まで会ったことのない、でもこれからの未来を変える素敵なものや人との出会いを最適化することに貢献したい」「マイナー同士が繋がれるはずの空間で、まずメジャーにならないとマイナーにリーチできない状態を改善したい」という気持ちが昔あったんだ、そして機械学習に興味を持ったんだった、という初心を思い出せた。解決したい社会課題も持たずにフラフラ生きてるのかしらとやや自己嫌悪していたのがスッと晴れたのがとても良かった。初心大事。

作業日誌2018-10-01

【やったこと】

  • CourseraのWeek3、Metricsのアサインメントを完了。
  • Mean encodingの動画視聴を開始。

【わかったこと / 進捗があったこと】

  • 今まで知っていた指標も、知らなかった指標も、網羅的に知ることができてよかった。実務でモデル評価する時に役に立ちそう。

【考えたこと】

  • この講座終わったら、俺、線形代数をやるんだ…。

作業日誌2018-09-30

【やったこと】

  • CourseraのHow to Win a Data Science CompetitionのWeek2のData Leakagesのアサインメントを提出して終了。Week3のRegressionに関する評価指標について動画を見た。
  • 手を止めていた自己分析ジャーナルを進めた。

【わかったこと / 進捗があったこと】

  • 評価指標には誤差の絶対値で評価するものと、誤差を標準化して評価するものとある。

【考えたこと】

  • この講座、kaggle特化でこの評価指標も割とKaggle対策的な感じになる気がしている。予備校にいきなり来ちゃった感はあるけれど、それはそれで理解が深まって良い。
  • やっぱり終わったらNg教授のコースも取ろう。
  • 何になりたいか、何をしたいか、定期的にワークをしておくのは大切だなと思った。
    • コーチング的な話し方やコーチングについて、知識としては知ってるけれど、実際の「コーチング」受けたことはない。受けてみたいな。

作業日誌2018-09-27

【やったこと】

  • CourseraのHow to Win a Data Science CompetitionのWeek2、Data Leakagesまで進めた。
  • 体調が良くないのでゲームをやった。FGOの推しキャライベントを進めて欲しかったアイテムを手に入れた。
  • 病院に行った。

【わかったこと / 進捗があったこと】

  • Data leakagesって何ってところから始まったので、なるほどさすがkaggle特化クラスだなと思った。
  • 明朝、ひどい吐き気と血の気の引くような感覚、すごい勢いで冷たさを感じてむしろ熱は無いのに汗がにじみ出る、ふらふらとしてまともに立てないという状態になる。少し落ち着いた後に幸運にも?寝付いてしまい、起きたら気分は改善されていた。あまりにも怖い症状でびっくりしたけれど、フォロワーさん曰く寝冷えでそうなることもあるとか。風邪で喉も腫れていたので、それも相まったかなと思われる…。

【考えたこと】

  • アサインメントが難しくてよくわからなくてつらい。よりによってアサインメントがValidationじゃなくてData Leakagesとは…。