Follow #ソシム販売部Twitterアイコン

 

増補改訂Pythonによるスクレイピング&機械学習開発テクニック

クジラ飛行机

スクレイピングと機械学習のベストセラーがパワーアップ!

定価
3,520円(本体価格 3,200円)
  • 発売日
    2018年12月15日
  • 判型/ページ数
    B5変型/432ページ(2色)
  • ISBN
    978-4-8026-1192-3
キーワード:
/ / / /

スクレイピングと機械学習のベストセラーがパワーアップ!

本書は、2016 年に発売され好評だった『Pythonによるスクレイピング&機械学習開発テクニック』を大幅に改訂したものです。

今回の改訂では、
・ソースコードの全面見直し
・Scrapyの解説を加筆
・TensorFlow Ver1.10以降に対応
・セキュアなHTTPSサイトへの対応
・SeleniumによるFirefoxの自動操縦の加筆
を行いました。

なお、前回の書籍を買われた読者の方も、追加部分以外の流れは同じなので、
今回のソースコードを是非ダウンロードしてみてください。

第0章 クローリング、スクレイピングそして機械学習

0-1 ビッグデータはネットにある

第1 章 クローリングとスクレイピング

1-1 データのダウンロード
1-2 BeautifulSoup でスクレイピング
1-3 CSS セレクターについて
1-4 リンク先を丸ごとダウンロード

第2 章 高度なスクレイピング

2-1 ログインの必要なサイトからダウンロード
2-2 ブラウザーを経由したスクレイピング
2-3 スクレイピング道場
2-4 Web API からのデータ取得
2-5 cron と定期的なクローリング
2-6 Scrapy を使ったスクレイピング
2-7 Scrapy で夏目漱石の全作品をダウンロードしよう
2-8 Scrapy とSelenium で動的Web サイトをダウンロード

第3 章 データソースと書式・整形

3-1 Web のデータはさまざまのフォーマット
3-2 データベースについて

第4 章 機械学習

4-1 機械学習とは
4-2 機械学習はじめの一歩
4-3 画像の文字認識
4-4 外国語の文章を判定
4-5 サポートベクターマシン(SVM) について
4-6 ランダムフォレスト
4-7 学習データを検証する

第5 章 深層学習に挑戦しよう

5-1 深層学習とはなにか
5-2 TensorFlow のインストール
5-3 Jupyter Notebook のススメ
5-4 TensorFlow の基本を押さえよう
5-5 TensorBoard で視覚化しよう
5-6 TensorFlow で深層学習に進もう
5-7 Keras でもっと楽に深層学習を実践しよう
5-8 Pandas/NumPy を使いこなそう

第6 章 テキスト解析とチャットボットの作成

6-1 日本語の解析(形態素解析)について
6-2 Word2Vec で文章をベクトル変換しよう
6-3 ベイズの定理でテキストを分類しよう
6-4 MLP でテキスト分類してみよう
6-5 文章の類似度をN-gram で調べよう
6-6 マルコフ連鎖やLSTM で文章を生成しよう
6-7 チャットボットの作成

第7 章 深層学習を実践してみよう

7-1 類似画像の検出をしよう
7-2 CNN で画像分類に挑戦しよう
7-3 牛丼屋のメニューを画像判定しよう
7-4 OpenCV で顔認識
7-5 画像OCR – 連続文字認識に挑戦しよう

Appendix 作業の準備と環境構築
Appendix-1 VirtualBox/Vagrant を使う方法
Appendix-2 Docker で開発環境を構築しよう
Appendix-3 Python + Anaconda の環境を整える

ダウンロードデータ

本書で解説したサンプルデータを以下のサイトからダウンロードできます。 なお、使用方法などに関しては、必ず書籍の該当箇所をご確認の上、ご利用ください。

アクセス後、右上にある「「Clone or download」から「download ZIP」を選んでダウンロードして下さい。

お問い合わせ

本書に関するお問い合わせは、下記のボタンをクリックしてお問い合わせフォームよりお問い合わせください。

この書籍を問い合わせる

[ この書籍をシェアする ]

新刊から本を探す

もっと見る

カテゴリから本を探す

シリーズから本を探す

本を探す