Google Cloud Professional Data Engineer試験に合格した話

この記事は何?

先日Google Cloudの認定資格の一つである「Professional Data Engineer」の試験を受験し,無事に合格を勝ち取ることができました.この記事では,試験対策方法や受験日当日の注意点などについて紹介していきます.

ちなみに合格者にはパーカーなどの記念品をプレゼントしてくれるようです.今はアメリカからの発送待ちで,着るのを楽しみにしています.

試験対策前の前提知識・経験

・業務でBigQueryにクエリを投げたりしているデータサイエンティスト.SELECT * したらスキャン量が大変なことになる,など常識的なことは(多分)知っている程度.

・その他のGoogle Cloudプロダクト(データエンジニアリング関連)はほとんど使ったことなし.Kaggle用途でVMインスタンスを立てたことがあるくらい.

機械学習は2013年から勉強しており,業務でも3年以上は扱っている.そのため,機械学習関連の対策はあまり必要なかった.

クラウドの試験対策をするのは初めてでしたが,何とかなりました.目安として,CLIの黒画面に怯えない程度のエンジニアリング歴と,応用情報を取得する程度の基本的なデータベースやSQL関連の知識があれば(データエンジニアの3年程度の経験が目安の試験なので大変なのはもちろんですが)何とか勉強は進めていけるかなと思います.

勉強期間(実績ベース)

下記の対策トータルでかかったのは2ヶ月.仕事をしながらなのでもっと短縮することは可能と思われます.

試験対策として勉強したこと

公式Coursera(約1ヶ月)

おすすめ度:★★★★★ (5/5)

「認定準備」と銘打ったコースは6つありますが,ご自身の事前知識に応じて飛ばし飛ばし受講すると良いでしょう.全てをゆっくり聞いているとかなりの時間がかかりそうです.その中でも,

こちらの試験対策講座がイチオシです.まずやらない手は無いでしょう.試験の対策のためのポイントをふんだんに盛り込んでくれます.あえて序盤に受講して,自分の知識の足りないところを逆算してその他のコースをパラシュート的につまみ食いしていくのも良さそうです.

一つ注意したいのは,この講座の練習問題の難易度は本番よりもやや簡単であるということです.Courseraだけで対策を終えて本番を迎えると痛い目を見ると思います.

公式模試(30分×解き直し回数)

おすすめ度:★★★★★ (5/5)

こちらも自明に大事なので,満点近く取れるまで時間を空けて何度か受けましょう.不正解選択肢の理由も含めて解説を読み込むと良いでしょう.

cloud.google.com

公式本(演習問題を2-3週間くらいかけて埋める)

おすすめ度:★★★★ (4/5)

英語に抵抗がない方は買うといいと思います.しかしながら,この本は本文はそこまで読んでいません(パラパラとめくってみましたが,英語を頑張って読み解く割には載っている情報が公式ドキュメントよりもやや薄めかなと思いました).この本を購入する旨味は,なんと言っても購入者特典で豊富な演習問題がWebサービスとして提供される点です.難易度や問題の癖は正直,本番のそれと異なるものもありますが,278問もの演習+不正解選択肢を含めた解説があるのは貴重です.個人的には大きな助けになりました.下図のように,演習問題の進捗を円グラフで示してくれるので「全部緑で埋めたい」というモチベーションが湧きやすいのも嬉しい設計になっています.

公式本の演習問題の進捗円グラフ

Udemy(6時間×解き直し回数)

おすすめ度:★★★★★ (5/5)

上記「公式本」の著者,Dan Sullivan氏のオリジナル模擬試験がコースの終盤に入っていて,本編をすっ飛ばして模試だけ受けることができます.私は動画講義は一切聞いていませんが,理解度に不安のある方は活用してもいいかもしれません(字幕も英語なので得意じゃない方は厳しいかも).

 

同氏の模擬試験2回分「だけ」のコースです.いい問題が揃っていると思うので頑張って英語を読むかDeepLにかけるかして解くと良いでしょう.

 

非公式ですが,紹介している模擬試験の類で一番歯応えがあり難しい問題が揃っていました.このレベルで合格点を出せるなら合格が近づいてきていそうな気がします.ただし,不正解選択肢の解説が不足しているので,自分でドキュメントを睨みながら納得していく必要がありそうです.

Whizlabs 無料模擬試験(20分×解き直し回数)

おすすめ度:★★★ (3/5)

LMS | Whizlabs

上記リンクから,Whizlabsという独自のトレーニングプログラムを販売しているサービスの模試を20問だけ無料で受けることができます.あくまで非公式ですし出題の傾向も本番のそれと異なるのでここまではやらなくてもいいかなと個人的には思います.課金するとより多くの問題演習や実践プログラムが提供されるみたいです.

上記の問題演習中に「知らなかったこと」をメモにまとめる

おすすめ度:★★★★★ (5/5)

例えば「Dataprocのベストプラクティス」→「GCSをストレージにする,プリエンプティブルVMは最大セカンダリワーカー数の30%以下にする,エフェメラクラスタを使う」など典型パターンは丸ごと暗記しておくと正解率が上がってきます.そういったパターンをメモにまとめ,暗記カードのノリで一問一答集を作り暇な時間に解いておくと記憶に定着すると思います.私の場合は,Notionのトグル機能を使って答えの表示・非表示を切り替えるスタイルで暗記作業を続けていました.

試験当日ギリギリもこれを眺めておけば,精神安定剤代わりになること請け合いです.(ちなみに私はデータエンジニア素人なので実にこのメモがA4用紙19ページに及びました…)

トグル機能を使って自作の一問一答集を作った様子

受験体験記

受験にあたってはお近くのテストセンターを探し,自分で好きな時間に予約をする形になります.私は東京に住んでいるので複数の選択肢から好きな会場を選ぶことができたのですが,Googleマップのレートが高く評判が良さそうなのと,Googleさんのオフィスが近くて縁起がいいことから渋谷会場を選びました.なお,土日を中心に意外と早く予約枠が埋まりやすいのでご注意ください.

 

テストセンターに関する情報

・身分証の提示が2種類+リマインダーメールの印刷が必要になるのでご注意ください.クレジットカードは「裏面に署名がされたものが必須である」などと言われ相当細かく確認されるので,念のため身分証は多めに持っていった方が良いかもです.(私の場合免許証+会社の保険証でイケました)マスクを脱いで顔写真との照合も行われます.


・試験場ではイヤーマフが置いてあるほか,事前の案内中に耳栓を希望して借りることができました.個人的に頭を圧迫されるのが苦手なので耳栓サービスはとても有難かったです.


解答中の情報

・問題文のフォントが日本語の漢字に対応していない?っぽく,中国語(?)の字体で表示されていて少々読みにくいです.


・模試でもそうだと思いますが「この問題文だけからだと一意に解を絞れなくない?」というパターンが時折あります.ので,局所最適というよりは全体最適を意識した選択肢を選ぶと良さそうです.ベストプラクティスをよく意識しておくことが大切そうです.


・時計は要りません(画面に残り時間が出ます)


・「次の問題へ」ボタンと「提出」ボタンの配置が結構近くにあるので,誤クリックして途中投了しないようにお気をつけください.

終わりに

この記事では,Google Cloud Professional Data Engineerの試験対策と受験体験記をまとめました.少しでも興味のある方にお役に立てていれば幸いです.