はじめに
こんにちは。スマートニュース株式会社 の小宮です。広告プロダクトのエンジニアをしています。 先日の AWS Summit Tokyo 2015 で、同じく広告プロダクトのエンジニアである蘭とともに「SmartNews のデータサイエンティストの高速イテレーションを支える広告システム」というお話をしてきました。このエントリはそのご報告になります。 今回の発表では「広告システム」と「iterative なデータサイエンスによる改善」をトピックとして、AWS の各種サービスを弊社の広告プロダクトでどのように活用しているのかについてお話させていただきました。 特に、今回の発表では多く触れなかった「エモーショナル」な思い・考え方については、弊社の広告プロダクト責任者である渡部が 事前にお話したこと
具体的な発表内容については上記スライドを参照していただくのがよろしいかと思いますが、ざっくりと要約すると
- 弊社のようなスタートアップは「本当に大事なところ (事業)」に社内のリソースを集中するべきであって、そのためには AWS など外部のマネージドサービスやリソースを積極的に有効活用することが必要。おかげで、”Raku” なオペレーションを実現している。
- データサイエンスの高速な iteration を実現するために、AWS の各種サービスや優れた OSS など、よいところを組み合わせて利用している。
Dev & Data
Machine Learning を技術の中核に据える組織の「データサイエンスの高速な iteration」を実現するためには、開発者 (Dev) とデータサイエンティスト (Data) が協調しつつ、互いの専門スキルを発揮できる環境作りが必要となります。今回の発表では「A/B テストのサイクル」を例に、弊社の広告システム開発における開発者とデータサイエンティストの関わり合いをご説明しました。
開発者は自身の得意とするエンジニアリングによって、A/B テストのサイクルに関わるルーチンワークを自動化したり、データサイエンティストがアドホックに分析しやすいプラットフォームを構築したり、データサイエンティストが作り上げた予測モデル・ロジックの production への反映を手助けする仕組みづくりをします。
これにより、データサイエンティストは予測モデルの構築やロジックの開発に集中できるようになり、その結果、予測モデルの構築から productioin への反映、A/B テストからのフィードバックまでの一連のサイクルを高速に回せるようになります。
この仕組みを作り上げる上で、S3 や EMR, Redshift, DynamoDB などの AWS の各種サービスを中心に、Chartio などの外部サービスや優れた OSS を積極的に活用しているわけです。
このように、Dev & Data が協調する組織・分析基盤作りをしているスマートニュースですが、よりよりプロダクトを作るためには、いま以上によりよい組織・分析基盤が必要です。
このブログエントリを読んで興味を持たれたエンジニアやデータサイエンティストの方、弊社は絶賛採用活動中ですので、以下からカジュアルにご応募ください!
http://about.smartnews.com/ja/careers/
こちらもあわせてお読みください
嬉しいことに、私達のセッションの内容をブログエントリにまとめてくださった方がいらっしゃいました。ありがとうございます!こちらもぜひご覧ください。