Fine-tuning (dostrajanie) to proces stosowany w uczeniu maszynowym, polegający na modyfikacji wag wewnętrznych gotowego modelu bazowego przy użyciu dedykowanego zbioru danych. Zamiast polegać na ogólnej wiedzy modelu (lub podawaniu długich instrukcji w oknie czatu), dostarcza się mu setki ustrukturyzowanych przykładów (par składających się z wejścia i pożądanego wyjścia), aby nauczył się ściśle określonego schematu działania.
Co to znaczy
Wbrew popularnym przekonaniom w branży, fine-tuning rzadko służy do „wgrywania” firmowej bazy wiedzy, regulaminów czy cenników (do wstrzykiwania twardych faktów i kontekstu informacyjnego wykorzystuje się techniki takie jak RAG — Retrieval-Augmented Generation). Fine-tuning jest techniką uczenia modelu formatowania wyjścia. Kiedy standardowe instrukcje nie przynoszą odpowiedniej i stabilnej stylistyki odpowiedzi (np. asystent w systemach API odpisuje niezgodnym, kwiecistym żargonem zamiast krótkich raportów klasyfikacyjnych o odpowiedniej składni tabelarycznej pod wewnętrzne zlecenia programistyczne), zastosowanie metody z trenowaniem dedykowanego modelu za pośrednictwem środowiska interfejsu (na przykładach udanej interakcji z BOK w ilości liczącej z reguły ponad kilka tysięcy zarchiwizowanych wierszy dla API) zespaja nowy rzut zachowawczy bota tak trwale, że model ten staje się zoptymalizowany dla tego procesu jako powtarzalny mechanizm produkcyjny dla danego wąskiego zdania i komendy.
Dlaczego to ważne
Kiedy standardowy prompt w okienku dla pracownika nie daje wystarczającej pewności jakości, a automatyzacje masowe wymagają gwarancji perfekcyjnego formatu tekstowego pod zrzuty dla arkuszy deweloperskich. Jest to często element pracy zaawansowanych inżynierów projektujących logikę zoptymalizowaną procesowo z myślą o redukcji kosztu tokenów (im lepszy wytrenowany model pod zadanie u dostawcy z serwerem, tym krótszy staje się potrzebny wejściowy kod polecenia instruujący bota, co zmniejsza zużycie limitów zapytań z chmury).
Agencja tworzy narzędzie do automatycznej kategoryzacji zapytań spływających z formularzy na witrynie sprzedażowej (tzw. zjawisko przyporządkowania typu Intencji Leadów). Modele ogólne mimo wielu prób poleceń w 30% mylą się kategoryzując trudne pytania do ogólnych reklamacji. Zespół przygotowuje kilkaset starych, poprawnie otagowanych przez pracowników i zaklasyfikowanych z odpowiednim nagłówkiem wiadomości i wysyła je na bezpieczne środowisko do modułu odpowiedzialnego na dostrajanie (API modelu do tuningu). Powstały dedykowany model radzi sobie na bieżących, zawiłych i nieskładnych gramatycznie komunikatach klientów natychmiastowo przydzielając ich zgłoszenia we wgranym odpowiednio pożądanym formacie tabelarycznym wspierając niezawodność logistyki obsługi.
Czym to nie jest
- Metodą Zero-Shot Prompting w okienku czatu. Fine-Tuning polega na zmianach w architekturze wewnętrznej po stronie usługi chmury w procesie płatnym i długotrwałym na wydzielonym klastrze zasobów z testowaniem dla konkretnego projektu z dedykowanymi danymi załadowanymi przez programistów u developera z zaplecza przed wdrożeniem interfejsu.
- Rozwiązaniem RAG polegającym na udostępnianiu botowi plików PDF do przeszukania we własnej bazie — fine tuning to nie asymilowanie nowych wiadomości ale strojenie zachowań połączone trwale w mechanice generowania z wag dla logiki modelu i estetyk powtarzanej konwersacji.
Jak rozpoznać
Pojęcia i procesy np. z członami „Inżynieria bazy wiedzy dla asystentów z zjawiskiem Retrievalu w technologii baz RAG (Retrieval-Augmented Generation) dla szukania w dokumentacjach”, „operacje optymalizacji transfer learningowych”.