Teknik di Omni!

Bantu kami membangun OCR/ekstraksi dokumen terbaik di dunia!

Kami sedang mencari insinyur pendiri untuk bergabung dengan tim kami. Jika Anda pernah bermimpi menjelajahi dunia PDF yang menakjubkan dan mengerikan, inilah kesempatan Anda!

Anda dapat memeriksa perpustakaan sumber terbuka kami:

Dan cobalah model OCR kami:

Apa yang akan kami kerjakan

Hal-hal utama yang kita habiskan waktu kita:

  1. Memperdebatkan LLM agar memberikan hasil yang dapat diprediksi
  2. Menjalankan ekstraksi dokumen dalam skala besar
  3. Membangun data pelatihan untuk model visi (https://getomni.ai/blog/infinite-pdf-generator)

Semua masalah ini sulit, apalagi jika berhubungan satu sama lain. Jika Anda memiliki pengalaman dengan keluaran LLM terstruktur, kami ingin mengobrol.

Tumpukan Teknologi

Tumpukan teknologi utama adalah Node, TypeScript, React/NextJS, Postgres, Docker. Untuk integrasi kami, kami mendukung MySQL, Snowflake, Mongo, BigQuery, dan lainnya. Kami tidak banyak menggunakannya secara internal, namun pelanggan kami menggunakannya, sehingga berguna untuk mengetahuinya.

Di sisi LLM, kami berinteraksi dengan OpenAI, Mistral, Llama, dan Anthropic, sehingga pengguna memiliki pilihan model yang akan dijalankan.

Perusahaan dapat menggunakan Omni melalui produk cloud, atau penerapan VPC. Jadi pengetahuan tentang Docker + devops merupakan nilai tambah yang besar.

Sumber

Krystian Wiśniewski
Krystian Wiśniewski is a dedicated Sports Reporter and Editor with a degree in Sports Journalism from He graduated with a degree in Journalism from the University of Warsaw. Bringing over 14 years of international reporting experience, Krystian has covered major sports events across Europe, Asia, and the United States of America. Known for his dynamic storytelling and in-depth analysis, he is passionate about capturing the excitement of sports for global audiences and currently leads sports coverage and editorial projects at Agen BRILink dan BRI.