Software Engineer for Infrastructure
- Tokyo
- Remote OK
- Full-time
- August 22, 2023
What you will do/仕事内容
LeapMindでは、低消費電力でディープラーニングを実現する学習・推論ソフトウェアスタックおよびアクセラレータIP等の製品群「Efficiera」を開発しています。
LeapMindのミッションである「機械学習を使った今までにないデバイスをあまねく世に広める」の実現に向け、技術的な専門性を活かして情報インフラシステムに貢献する方を募集します。
特にInfrastructureチームでは、“LeapMindのエンジニア全体の生産性の最大化を技術的側面から実現する”というチームミッションのもと、Bazel・Kubernetesなどといった技術スタックを用い、CI/CDや計算資源用自社GPUクラスタなど全社のプロダクティビティを向上させるシステムの改善に取り組んでいます。
このミッションの達成のため、オンプレミス・クラウド環境をまたいでシームレスに実現することができる優秀なソフトウェアエンジニアを求めています。
We, LeapMind Inc., are now developing a product family called “Efficiera”, which includes a learning and inference software stack and accelerator IP that enables deep learning with low power consumption.
We are looking for a person who can contribute to our IT infrastructure system by leveraging technical expertise to realize LeapMind's mission “To create innovative devices with machine learning and make them available everywhere”.
In particular, based on the Infrastructure team's mission “We maximize the productivity of LeapMind Engineers from a technology point of view”, we work on the systems that improve productivity across the company, such as CI/CD and our own GPU cluster for computing resources, using new technology stacks such as Bazel and Kubernetes.
In order to achieve this mission, we are looking for talented software engineers who can seamlessly achieve across on-premises and cloud environments.
Kubernetes・各種Cloud serviceを用いたGPUクラスタ/サービス基盤の設計・構築・運用
deep learningにおける計算を社内で効率的に回すための新しい分散計算処理システムの設計・構築・運用
IP合成から機械学習までを含むソフトウェアプロダクトのCI/CDの開発・運用
様々なバックグラウンドやスキルを持つチームメンバーと協力し、社内開発システムの管理・改善プロジェクトの推進
Bazelを用いた社内ビルドシステム構築
Design, construction, and operation of a GPU cluster/service infrastructure using Kubernetes and various cloud services
Design, construction, and operation of a new distributed computational processing system for efficient in-house computation in deep learning
Develop and operate CI/CD for software products that include everything from IP synthesis to machine learning
Collaborate with team members of various backgrounds and manage and drive improvement projects for internal development systems
Establish an in-house build system using Bazel
本ポジションでは以下の業務を担当して頂きます:
You will be in charge of the following:
What you will need/必須スキル
コンピューターサイエンスおよび関連技術分野での学士号、もしくはそれに相当する実務経験
Golang, C++, Pythonのいずれかでのコーディング経験
2年以上のWebサービス/アプリケーションの開発運用経験
2年以上のLinuxのAdministrator実務経験
Docker/Kubernetes環境でのアプリケーション運用経験
Nginx/Apacheなどのサーバーアプリケーションの理解・実務経験
TCP/IPの理解、Firewall, WAF等のNWセキュリティへの理解
日本語及び英語でのビジネスレベルのコミュニケーションスキル
Bachelor’s degree in computer science or related field, or equivalent work experience
Coding experience in either Golang, C++, or Python
2+ years of experience in web service/application development and operation
2+ years of experience working as a Linux Administrator
Experience operating applications in Docker/Kubernetes environment
Practical experience and understanding of server applications such as Nginx/Apache
Understanding of TCP/IP and NW security such as Firewall, WAF, etc.
Business level communication skills in Japanese and English
Personalities/歓迎スキル
- コンピューターサイエンスおよび関連技術分野での修士号、博士号、もしくはそれに相当する実務経験
- Bazelを用いた開発経験
- GNU Makeを用いた開発経験
- MySQL, PostgreSQLなどのRDBMSの理解・実務経験
- 各種合成ツールを用いた開発経験
- Golang/gRPCによるサービス開発・コーディング経験
- オンプレミス環境の設計・構築・運用の実務経験
- 機械学習基盤を含むHPC環境における実務経験
- チームでの開発経験もしくはOSSプロジェクトでの開発経験
- 以下のようなSREとしての実務経験
- SLO/SLIを設計して実際に運用をした経験
- キャパシティプランニングを行った経験
- パフォーマンス・レイテンシを計測に基づき改善した経験
Master’s or Ph.D. degree in computer science or related field, or equivalent work experience
Experience in development using Bazel
Experience in development using GNU Make
Practical experience and understanding of RDBMS such as MySQL, PostgreSQL, etc.
Experience in development using various synthesis tools
Experience in service development and coding using Golang/gRPC
Practical experience in designing, building, and operating of on-premises environments
Practical experience in HPC environment including machine learning infrastructure
Practical experience developing in a team or in an OSS project
Practical experience as an SRE as below
Experience in designing and operating SLO/SLI
Experience in capacity planning
Experience in improving performance and latency based on measurements
Personalities/求める人材
何が本質的な課題なのかを常に意識できる方
Projectを自身で能動的に推進することのできる方
不足する知識を補って自律的に学習しながら作業をすすめることのできる方
Be able to keep the focus on what are the essential issues
Those who can actively drive projects by themselves
Able to work autonomously while learning to compensate for lack of knowledge
Be able to keep the focus on what are the essential issues
Those who can actively drive projects by themselves
Able to work autonomously while learning to compensate for lack of knowledge
About LeapMind
LeapMind Inc. is developing its business with the company mission, “to create innovative devices with machine learning and make them available everywhere” and our original weight reduction technology for deep learning models, the dedicated circuit design, and leveraging the knowledge gained from the collaboration with more than 150 companies.
Our core product "Efficiera" is an ultra-low power AI inference accelerator that can be implemented on an FPGA device or ASIC/ASSP device, and is specialized for CNN inference operations, taking full advantage of our original deep learning model weight reduction method "extremely low bit quantization". It will enable advanced data processing by deep learning in environments where AI could not be used before.
Ultra low power AI inference accelerator IP EFFICIERA
"機械学習を使った今までにないデバイスをあまねく世に広める"を企業理念に、独自のディープラーニングモデルの軽量化技術や専用回路設計技術と150を超える企業との共創で得た知見を活かし、事業を展開しています。
私たちが開発したコア製品である”Efficiera"は、独自のディープラーニングモデル軽量化手法「極小量子化技術」を最大限に活かす、FPGAデバイス上もしくはASICデバイス上の回路として動作するCNNの推論演算処理に特化した超低消費電力AI推論アクセラレータIPで、今までAIが使えなかったような環境でもdeep learningによる高度な情報処理を可能にします。
超低消費電力AIアクセラレータIP EFFICIERA
Get Job Alerts
Sign up for our newsletter to get hand-picked tech jobs in Japan – straight to your inbox.