小澤昌樹氏のデータ分析コラム

  1. 第32回「スクレイピング(4)」複数ページを自動で巡回する(ページネーション)

    こんにちは、小澤です。前回は、BeautifulSoupを使ったスクレイピングの基本パターンについて整理しました。テンプレートの書き方や、find / find_all の使い分け、class や id を使った絞り込み、ブロック単位での処理など、実際にコードを書くための土台を確認しました…

  2. 第31回「スクレイピング(3)」BeautifulSoupを使うときの基本パターン

    こんにちは、小澤です。前回は、HTMLの構造とBeautifulSoupの役割を整理しました。スクレイピングは「画面を読む」のではなく、HTMLという構造データを読み解く作業であることも確認しました。今回は、その続きとして、BeautifulSoupを実際に使いこなすための基本パタ…

  3. 第30回「スクレイピング(2)」PythonとBeautifulSoupでHTMLを解析

    こんにちは、小澤です。前回は、スクレイピングとは何か、そしてどのような場面で役に立つのかを紹介しました。今回は実践をはじめる準備として、PythonとBeautifulSoupを使ってHTMLを解析するところまでを紹介しましょう。スクレイピングは「画面を見て情報を抜き取る作業」では…

  4. 第29回「スクレイピング(1)」

    こんにちは、小澤です。これまで、AutoMLツールやPythonによる機械学習のライブラリをいくつか紹介してきました。しかし、どんなに高度な分析手法があっても、そもそも「データがなければ何も始まらない」という現実があります。新しい価値を生み出すには、企業や組織が保持している内部データだけで…

  5. 第28回「近ごろの機械学習ライブラリ(5)mlxtend」

    こんにちは、小澤です。これまで、auto-sklearn、H2O AutoML、PyCaretといったAutoML(自動機械学習)ツール を紹介してきました。いずれも、プログラミングに不慣れな人でも機械学習を活用できるように設計されたツールで、AI導入のハードルを大きく下げてくれる存在です…

  6. 第27回「近ごろの機械学習ライブラリ(4)PyCaret」

    こんにちは、小澤です。前回は、auto-sklearn や H2O AutoML などの AutoML(自動機械学習)ツール を紹介しました。今回は、もうひとつ、注目すべきAutoMLライブラリである PyCaret(パイキャレット)を紹介します。PyCaretは「簡単・高速・実用…

  7. 第26回「近ごろの機械学習ライブラリ(3)Auto-sklearn、H2O AutoML」

    こんにちは、小澤です。前回は、PyTorch(パイトーチ) を使ってニューラルネットワークを構築する基本的な流れを体験しました。「モデルを自分で組む楽しさ」を感じられる内容でしたが、「もっと簡単にモデルを作れないか」と思った方もいるかもしれません。そこで、今回紹介するのがAutoMLという…

  8. 第25回「近ごろの機械学習ライブラリ(2)PyTorch」

    こんにちは、小澤です。前回は、Googleの機械学習ライブラリTensorFlow / Kerasを使って、シンプルなニューラルネットワークの作り方をご紹介しました。Keras の手軽さで、深層学習の入り口としてはかなり取り組みやすいということが伝わったかと思います。今回は、もう一…

  9. 第24回「近ごろの機械学習ライブラリ(1)TensorFlow/Keras」

    こんにちは、小澤です。これまで、scikit-learnを中心に、分類・回帰・クラスタリングなど、機械学習の基本的な手法を紹介してきました。scikit-learnはシンプルな構文で高機能な機械学習を実現できる便利なライブラリであり、機械学習の第一歩として最適です。さらに、より高度…

  10. 第23回「scikit-learnの使い方(9)クラスタリング」

    こんにちは、小澤です。これまでに見てきた「分類」や「回帰」は、あらかじめ正解ラベルが与えられているデータを用いて学習を行う「教師あり学習」に分類されるものでした。一方で、「教師なし学習」は、正解ラベルのないデータからパターンや構造を見つけ出す手法を指します。その中でも特に代表的な手…

PAGE TOP