Vjerojatno je najveći dio posla definirati matematički model, formulu ili nešto slično s kojim će računalo (odnosno AI) naučiti što je ispravno, što neispravno (kao kod binarne klasifikacije), te vjerojatno što je tek djelomično točno. Nakon toga treba pronaći ogromnu bazu od prethodno rješenih "jednađbi" (u ovom slučaju modele proteina). Ne znam odakle su uzimali sve te silne podatke.
Kad sam vježbao taj AI, bio je jedan vrlo jednostavan primjer; Kako prepoznati rečenicu koja je pisana u negativnom tonu, a kako onu u pozitivnom. Svodi se na to da ti treba ogromna količina prethodno definiranih pozitivnih i negativnih rečenica s kojima će AI trenirati te naknadno na svoj način "razumjeti" svaku slijedeću rečenicu koju unese korisnik. Najveći problem, često i nerješiv problem jest pronalaz tih testnih uzoraka za treniranje.