【ログ】日本リスキリングコンソーシアム経由でGoogleデータアナリティクス講座受けてみた④

はい、相変わらずに続きで〜す

データライフサイクルを追う

データにも生命と同じようにライフサイクルがある
計画、取得、管理、分析、保管、破棄、のフェーズがある。データそのもののライフサイクルとデータ分析ライフサイクル（問いかけ、準備、処理、分析、共有、行動）とを混同しないように注意。

データ分析プロセス

問いかけ、準備、処理、分析、共有、行動のそれぞれのフェーズでどのような振る舞いをするかの詳細を学んでいく。
一つの前段階として、学習ログで使ったデータを表で整理する振り返りを行う、

振り返り

「雀魂における直近5局の順位、得点」を取得するデータにしたので表にまとめる。うん、まとめた。

局目	順位	点数
1局目	4位	17300点
2局目	1位	40800点
3局目	1位	75300点
4局目	3位	17900点
5局目	4位	19700点

スプレッドシートの基本の取得

スプシはさんざん使ってるから基本は大丈夫かな〜。

直近の麻雀の順位と点数を可視化した。順位の場合一位が上にきてないと変なので、そこの部分を表現するのに少し手間取った。https://auto-worker.com/blog/?p=2039のサイトを参照にしました。ありがとう。

構造化クエリ言語（SQL）

これが一番やりたかった〜、ようやくたどり着いたぜ。
SELECT、FROM、WHEREが基本の構文で、それぞれ　以下を選択するものだと。うんうん、なるほど。

SELECT を使用して、返す列を選択します。
FROM を使用して、必要な列が存在するテーブルを選択します。
WHERE を使用して、特定の情報をフィルタします。

SELECT
　　　　求める列
FROM
　　　データを含むテーブル
WHERE
　　　特定条件
という形が基本の形で、構文エラーを減らすらしい。直感的には、テーブルを指定して、求める列を指定して、条件を指定するという流れが自然な用に感じるが、列→テーブル→特定条件、という条件らしい。間違えそ〜。

複数条件の場合、SELECTコマンドではカンマ区切り、WHEREコマンドはAND（やOR,NOTなどのコネクタ/演算子）を使用する。なるほど、場所ではなくて条件指定であるWHEREコマンドは自由度が高い表現ができるようになっているのね、理解。

SQLの無限の可能性

大文字、インデントを使用すると情報が読みやすくなる。インデントというのは、字下げをして空白を入れることね。
SQLステートメントの最後にはセミコロン（；）をつけること、これが終了の合図。なくてもいける場合があるらしい。

WHERE条件

完全一致ではない、文言も引き出すことができる。
完全一致の場合（field1の列の条件を指定したい場合）は、
WHERE
　　　field1=’〇〇’
部分一致でデータ抽出したい場合は
WHERE
　　　field1 LIKE’〇〇%’
で、それぞれデータが抽出される。ワイルドカード（任意の文字の部分↑だと%の部分）がアスタリスク（*）で表現される場合もあるらしい。

すべての列をSELECTする

SELECT*ですべての列を選択することができる。ただしデータ量が膨大になる場合は実行に時間がかかるため注意が必要

カラム名やテーブルの名前から、意味を把握しにくいような場合はコメントを適宜いれることで、何を実行したいのかが一目でわかるようになる。
コメントは「/*コメントコメント*/」「–コメントコメント」のような形で表記することでコメントとして認識される。クエリのステートメント内部以外でも、クエリ自体の説明などに使うことも可能。

エイリアス

AS句を使うことで、クエリ実行中に割り当てをすることができる。
クエリ内での呼称を統一したい場合に便利。データベースのテーブルには影響を与えない。
field1　AS　last-name — 作業用のエイリアス
みたいな感じで、使う。（上記は、field1ってカラムがラストネームを指しているけど、field1って名称のままだと分かりづらいから、このクエリ内ではラストネームって呼ぶことにするよって宣言をしたということ）

振り返り

基礎的な概念としてはだいぶ理解した気がする。実際自分が書いたSQLが動いてくれると嬉しい。
今後は以下のサイトでも練習をしながらやってみよ〜

SQLの練習ができる学習サービス | SQLab

SQLの練習ができるSQL特化の学習サービスです。環境構築不要で豊富な練習問題に取り組むことができます。SQLabを活用してSQLの知識をスキルに変えていきましょう。