• Amazonで購入

増補改訂Pythonによるスクレイピング&機械学習開発テクニック

スクレイピングと機械学習のベストセラーがパワーアップ!

著者
クジラ飛行机
定価
3,456円(本体価格 3,200円)
発売日
2018年12月15日
判型/ページ数
B5変型/432ページ(2色)
ISBN
978-4-8026-1192-3
備考
-

スクレイピングと機械学習のベストセラーがパワーアップ!

本書は、2016 年に発売され好評だった『Pythonによるスクレイピング&機械学習開発テクニック』を大幅に改訂したものです。

今回の改訂では、
・ソースコードの全面見直し
・Scrapyの解説を加筆
・TensorFlow Ver1.10以降に対応
・セキュアなHTTPSサイトへの対応
・SeleniumによるFirefoxの自動操縦の加筆
を行いました。

なお、前回の書籍を買われた読者の方も、追加部分以外の流れは同じなので、
今回のソースコードを是非ダウンロードしてみてください。


ジャンル
キーワード

読者サポート

  • ダウンロード

目次

第0章 クローリング、スクレイピングそして機械学習
0-1 ビッグデータはネットにある

第1 章 クローリングとスクレイピング
1-1 データのダウンロード
1-2 BeautifulSoup でスクレイピング
1-3 CSS セレクターについて
1-4 リンク先を丸ごとダウンロード

第2 章 高度なスクレイピング
2-1 ログインの必要なサイトからダウンロード
2-2 ブラウザーを経由したスクレイピング
2-3 スクレイピング道場
2-4 Web API からのデータ取得
2-5 cron と定期的なクローリング
2-6 Scrapy を使ったスクレイピング
2-7 Scrapy で夏目漱石の全作品をダウンロードしよう
2-8 Scrapy とSelenium で動的Web サイトをダウンロード

第3 章 データソースと書式・整形
3-1 Web のデータはさまざまのフォーマット
3-2 データベースについて
第4 章 機械学習
4-1 機械学習とは
4-2 機械学習はじめの一歩
4-3 画像の文字認識
4-4 外国語の文章を判定
4-5 サポートベクターマシン(SVM) について
4-6 ランダムフォレスト
4-7 学習データを検証する

第5 章 深層学習に挑戦しよう
5-1 深層学習とはなにか
5-2 TensorFlow のインストール
5-3 Jupyter Notebook のススメ
5-4 TensorFlow の基本を押さえよう
5-5 TensorBoard で視覚化しよう
5-6 TensorFlow で深層学習に進もう
5-7 Keras でもっと楽に深層学習を実践しよう
5-8 Pandas/NumPy を使いこなそう

第6 章 テキスト解析とチャットボットの作成
6-1 日本語の解析(形態素解析)について
6-2 Word2Vec で文章をベクトル変換しよう
6-3 ベイズの定理でテキストを分類しよう
6-4 MLP でテキスト分類してみよう
6-5 文章の類似度をN-gram で調べよう
6-6 マルコフ連鎖やLSTM で文章を生成しよう
6-7 チャットボットの作成

第7 章 深層学習を実践してみよう
7-1 類似画像の検出をしよう
7-2 CNN で画像分類に挑戦しよう
7-3 牛丼屋のメニューを画像判定しよう
7-4 OpenCV で顔認識
7-5 画像OCR - 連続文字認識に挑戦しよう

Appendix 作業の準備と環境構築
Appendix-1 VirtualBox/Vagrant を使う方法
Appendix-2 Docker で開発環境を構築しよう
Appendix-3 Python + Anaconda の環境を整える

この書籍の購入

  • Amazonで購入する