Pelikan dengan sepeda. Saya memutuskan untuk meluncurkan tolok ukur LLM saya sendiri: seberapa baik berbagai model dapat menampilkan SVG seekor pelikan yang sedang mengendarai sepeda?

Saya memilih itu karena a) Saya suka pelikan dan b) Saya cukup yakin tidak ada file SVG pelikan di sepeda yang beredar (belum) yang mungkin sudah tersedot ke dalam data pelatihan.

Perintah saya:

Generate an SVG of a pelican riding a bicycle

Saya telah menjalankannya melalui 16 model sejauh ini – dari OpenAI, Anthropic, Google Gemini dan Meta (Llama berjalan di Cerebras), semuanya menggunakan saya LLM utilitas CLI. Ini milikku (Claude membantu) Skrip pesta: menghasilkan-svgs.sh

Berikut Claude 3.5 Soneta (20-06-2024) dan Claude 3.5 Soneta (22-10-2024):

Gemini 1.5 Flash 001 dan Gemini 1.5 Flash 002:

GPT-4o mini dan GPT-4o:

o1-mini dan o1-pratinjau:

Otak Llama 3.1 70B dan Llama 3.1 8B:

Dan perhatian khusus untuk Gemini 1.5 Flash 8B:

Sisanya adalah ditautkan dari README.

Sumber

Krystian Wiśniewski
Krystian Wiśniewski is a dedicated Sports Reporter and Editor with a degree in Sports Journalism from He graduated with a degree in Journalism from the University of Warsaw. Bringing over 14 years of international reporting experience, Krystian has covered major sports events across Europe, Asia, and the United States of America. Known for his dynamic storytelling and in-depth analysis, he is passionate about capturing the excitement of sports for global audiences and currently leads sports coverage and editorial projects at Agen BRILink dan BRI.