Pojawienie się nowego modelu AI, który może konkurować z wydajnością GPT-4, wzbudza emocje w społeczności technologicznej. Szczególne zainteresowanie budzi fakt, że został on “zleakowany” przez firmę Mistral, znaną z otwartych rozwiązań (open source) w dziedzinie sztucznej inteligencji. Co więcej, CEO Mistral potwierdził, że za “wyciekiem” stoi zbyt entuzjastyczny pracownik ich wczesnego klienta. Jakie mogą być długoterminowe skutki tego wydarzenia dla świata AI?
Tajemniczy przeciek na platformie HuggingFace
Wszystko zaczęło się od tajemniczego postu na HuggingFace. W ostatnich dniach stycznia, użytkownik o pseudonimie “Miqu Dev” umieścił zestaw plików, które sugerowały pojawienie się nowego dużego modelu językowego (LLM) o oznaczeniu “miqu-1-70b”. Te pierwsze doniesienia szybko przyciągnęły uwagę społeczności zajmującej się sztuczną inteligencją, ze względu na podobieństwa do formatu interakcji użytkownika znane z modeli Mistral.
Whatever Miqu is, it has some sort of special sauce. It gets an 83.5 on EQ-Bench (evaluated locally), surpassing *every other LLM in the world except GPT-4*. EQ-Bench has a 0.97 correlation w/ MMLU, and a 0.94 correlation w/ Arena Elo. It *beats* Mistral Medium – at Q4_K_M. I… pic.twitter.com/0gOOPjxjPD
— N8 Programs (@N8Programs) January 30, 2024
Szybko zaczęły pojawiać się spekulacje dotyczące pochodzenia “Miqu”. Anonimowy użytkownik na 4chan przekierował do plików, a dyskusja o potencjalnie nowym modelu Mistral rozgorzała na platformie społecznościowej X, wcześniej znanej jako Twitter. Użytkownicy zaczęli dzielić się swoimi spostrzeżeniami na temat wysokiej wydajności modelu w zadaniach typowych dla dużych modeli językowych, co tylko podsycało plotki.
Might be late but I am now 100% convinced that Miqu is the same model that's accessible as Mistral-Medium on Perplexity Labs. It was plausible that it knows standard puzzles, but there ain't no way in Hell a pranker has tuned it to identically phrase the responses in Russian too. pic.twitter.com/zZMcpspXch
— Teortaxes▶️ (@teortaxesTex) January 30, 2024
Potwierdzenie CEO Mistral i przyszłość otwartego AI
CEO Mistral, Arthur Mensch, oficjalnie potwierdził “przeciek” modelu. Wyjaśnił, że za nieoficjalne ujawnienie modelu odpowiada nadmiernie entuzjastyczny pracownik jednego z ich wczesnych klientów. Model, który wyciekł, był starszą wersją, oznaczoną znakami wodnymi, co jednak nie zmniejsza znaczenia tego incydentu dla świata AI.
Mensch zasugerował, że Mistral pracuje nad modelem dorównującym GPT-4. Fakt, że może powstać model open source, który miałby oferować wydajność porównywalną z GPT-4 OpenAI, wskazuje na szybki rozwój społeczności zajmującej się otwartymi rozwiązaniami w dziedzinie sztucznej inteligencji. To może wywrzeć ogromną presję na OpenAI, które do tej pory utrzymywało przewagę dzięki swoim modelom premium, w tym GPT-4 Turbo i GPT-4V (Vision).
An over-enthusiastic employee of one of our early access customers leaked a quantised (and watermarked) version of an old model we trained and distributed quite openly.
— Arthur Mensch (@arthurmensch) January 31, 2024
To quickly start working with a few selected customers, we retrained this model from Llama 2 the minute we got…
Co to oznacza dla przyszłości AI?
Open source AI szybko doganiają komercyjne giganty. Udział społeczności w rozwoju otwartych modeli AI, takich jak ten oferowany przez Mistral, może przyspieszyć innowacje i uczynić zaawansowane narzędzia sztucznej inteligencji bardziej dostępnymi. To nie tylko demokratyzuje dostęp do zaawansowanych technologii, ale także stawia pod znakiem zapytania przyszłość modelu biznesowego opartego na subskrypcjach, który do tej pory dominował w branży.
Zmiany mogą wpłynąć na rozwój technologii i dostępność narzędzi AI. Jeśli otwarte źródła będą kontynuować ten trend wzrostowy, możemy być świadkami przyspieszenia w rozwoju narzędzi AI, które będą dostępne dla szerszej grupy użytkowników. To z kolei może przyczynić się do innowacji w różnych dziedzinach, od edukacji po medycynę, gdzie AI ma potencjał znacząco wpłynąć na jakość życia i efektywność pracy.
Podsumowując, “przeciek” modelu AI przez Mistral może wydawać się jedynie małym incydentem, ale jego długoterminowe konsekwencje dla świata technologii mogą być znaczące. Świadczy o rosnącej sile i potencjale otwartego oprogramowania w dziedzinie sztucznej inteligencji, a także o szybkich zmianach, które zachodzą w tej dynamicznie rozwijającej się branży.