Czy Gemini przewyższyło ChatGPT? Poddaliśmy testom modele AI.

Z drugiej strony Gemini zapewnia ogólny przegląd instrukcji lądowania, o które prosiłem. Kiedy jednak zaproponowałem obie opcje ekspertowi ds. lotnictwa z Ars, Lee Hutchinsonowi, wskazał on na poważny problem w odpowiedzi Gemini: wskazówki Gemini są zarówno dokładne (w sensie „to są dosłowne kroki, które należy teraz podjąć”), jak i gwarantują, że cię zabiją, ponieważ pierwszą rzeczą, jaką mówi, jest to, że ty, prawdopodobnie niedoświadczony lotnik, musisz wyłączyć autopilota w gigantycznym dwusilnikowym odrzutowcu, zanim w ogóle zasugerujesz rozmowę z kontrolą ruchu lotniczego. Chociaż Lee przyznał Gemini punkty za „faktyczną odpowiedź na pytanie”, ostatecznie nazwał odpowiedź ChatGPT „bardziej praktyczną… ostatecznie ChatGPT daje bardziej przydatną odpowiedź (ponieważ) odpowiedź Google sprawi, że umrzesz, chyba że masz około 737 czasu i jesteś gotowy do ręcznego pilotowania samolotu pasażerskiego z ponad 100 duszami na pokładzie”. Z tych powodów ChatGPT musi to wygrać. Ostateczny werdykt To była stosunkowo zacięta walka, biorąc pod uwagę wyłącznie liczbę punktów. Gemini odnotowało cztery zwycięstwa w porównaniu z trzema w przypadku ChatGPT i jednym sędziowanym remisem. Niemniej jednak ważne jest, aby zastanowić się, skąd wzięły się te punkty. ChatGPT zdobył na przykład kilka stosunkowo wąskich i subiektywnych zwycięstw w stylu, jeśli chodzi o podpowiedzi dotyczące dowcipów taty i historii koszykówki Lincolna, pokazując, że może mieć niewielką przewagę w przypadku bardziej kreatywnych podpowiedzi do pisania. Jednak w przypadku podpowiedzi bardziej informacyjnych ChatGPT wykazał istotne błędy rzeczowe zarówno w biografii, jak i strategii Super Mario Bros., a także oznaki zamieszania w obliczaniu rozmiaru dyskietki systemu Windows 11. Tego rodzaju błędy, których Gemini w dużej mierze udało się uniknąć w tych testach, mogą z łatwością prowadzić do szerszego braku zaufania do ogólnego wyniku modelu sztucznej inteligencji. Podsumowując, wydaje się jasne, że Google zyskał sporo względnej wiedzy na temat OpenAI, odkąd przeprowadziliśmy podobne testy w 2023 r. Nie możemy winić Apple za przyjrzenie się takim przykładowym wynikom i podjęcie decyzji w sprawie partnerstwa z Siri.
已Opublikowany: 2026-01-21 15:03:00
źródło: arstechnica.com








