Beberapa minggu yang lalu, saya memberikan ceramah di milik Hannah Foxwell konferensi AI yang luar biasa untuk Kita Semua tentang sesuatu yang muncul di benak saya setelah bertahun-tahun bekerja di DevOps, MLOps, dan sekarang GenAI: hambatan terhadap rekayasa AI runtuh dengan cepat. Alat-alatnya sudah cukup baik sehingga jika Anda dapat menangani IDE dan memasukkan beberapa YAML ke git, Anda sudah memenuhi syarat.
Setelah menjalani evolusi dari DevOps (ClusterHQ) ke MLOps (Dotscience) dan sekarang mendalami GenAI dengan HelixML, saya terus melihat pola yang sama: alat yang rumit menjadi lebih sederhana, alur kerja menjadi terstandarisasi, dan tiba-tiba apa yang tampak seperti ilmu roket menjadi adil. .. lebih banyak rekayasa.
Membangun aplikasi AI terdiri dari enam blok bangunan:
-
Model: Hanya fungsi matematika. Yang rumit, tentu saja, tetapi pada intinya, mereka hanya mengubah kata menjadi angka dan kembali lagi.
-
Anjuran: Memberi tahu model apa yang harus dilakukan dalam bahasa Inggris sederhana. Terkadang Anda harus sangat eksplisit – seperti berbicara dengan balita.
-
Pengetahuan: Basis pengetahuan pribadi AI Anda. Dokumen, situs web, apa pun yang Anda perlukan untuk belajar.
-
Integrasi: Di sinilah hal menariknya – menghubungkan AI Anda ke sistem bisnis nyata melalui API.
-
Tes: Karena tidak ada yang ingin AI-nya menyimpang dalam produksi. Ya, Anda dapat menguji aplikasi AI, dan Anda memang harus melakukannya.
-
Penyebaran: Menjalankannya di server. Misalnya, membuat versi seluruh aplikasi di atas dalam file yaml dan menggunakan Flux untuk mengelola penerapan ke K8 dan Helix.
Di sinilah latar belakang DevOps saya berperan. Anda tahu semua alat yang sudah Anda gunakan? Git? Saluran pipa CI/CD? Mereka juga berfungsi untuk aplikasi AI. Saya mendemonstrasikannya secara langsung dalam pembicaraan dengan membangun integrasi Jira yang dapat menulis kode berdasarkan deskripsi tiket.
Saus rahasianya? Sesuatu yang kami sebut “spesifikasi AIS” – file YAML yang menyatukan semua bagian ini dengan cara yang terasa alami bagi siapa saja yang bekerja dengan alat infrastruktur modern.
Hal ini penting: saat Anda menggunakan model sumber terbuka, data Anda tetap menjadi milik Anda. Itu tidak berakhir dengan melatih model orang lain. Bagi perusahaan yang mengkhawatirkan GDPR atau peraturan nasional, regional, atau perusahaan lainnya, hal ini penting. Anda dapat menjalankan semuanya secara lokal, di infrastruktur Anda sendiri, dengan data Anda tetap berada di tempat yang diinginkan tim hukum Anda.
Jika Anda membaca ini sambil berpikir “tunjukkan kodenya”, saya siap membantu Anda. Berikut arsitektur referensi lengkap yang dapat Anda atur sendiri untuk melakukan hal ini: https://github.com/helixml/genai-cicd-ref
Dan berikut tutorial lengkap penggunaan dan pengaturan arsitektur referensi:
Hal utama yang saya ingin Anda ambil adalah ini: jika Anda dapat menangani kontrol versi dan alur kerja penerapan dasar, Anda dapat membangun aplikasi AI yang siap produksi. Alatnya ada di sana. Modelnya ada di sana. Dan mereka menjadi lebih baik setiap hari.
Memeriksa aispec.org jika Anda ingin menggali format standar, kami mengusulkan semua ini. Atau jika Anda ingin ngobrol tentang hal ini, temukan saya di LinkedIn atau kirimi saya email di Lukas@helix.ml.
Ini tentang membuat rekayasa AI dapat diakses oleh semua orang yang mengetahui cara mengirimkan kode. Tidak diperlukan gelar PhD, tidak ada keajaiban – hanya praktik teknik yang solid yang diterapkan pada alat baru yang canggih ini.