La IA i el mite de l'aleatorietat: Què revela el teu model de llenguatge?

L'experiment: Per què les IA sempre trien el mateix nombre?

És un fenomen recurrent: en demanar a un model de llenguatge que triï un nombre «aleatori» entre 1 i 100, la resposta sol ser 42 o 73. Lluny de ser una coincidència, aquest comportament és una empremta digital estadística que revela com s'ha construït la seva base de coneixement. En realitzar proves amb sis models diferents (Claude, Gemini, Copilot, DeepSeek, GLM-5.1 i Grok), queda clar que el que percebem com una elecció a l'atzar és, en realitat, un procés de predicció de tokens basat en la cultura humana.

Biaixos en la programació i l'entrenament

Els models entrenats amb dades centrades en la programació i comunitats tècniques tendeixen a triar el nombre 42, una referència directa a The Hitchhiker's Guide to the Galaxy. Per contra, aquells amb una exposició més àmplia a la cultura mainstream s'inclinen pel 73, el «nombre favorit» de Sheldon Cooper a The Big Bang Theory. Això demostra que els LLMs no calculen; simplement repliquen patrons de text humà.

«El model no està llançant un dau; està predient què diria un humà en aquesta situació específica basant-se en la probabilitat estadística de les seves dades d'entrenament.»

El parany de l'aleatorietat en el desenvolupament

Quan intentem forçar el model a ser més «objectiu» mitjançant prompts de context tècnic, el resultat no millora, només canvia el biaix. Alguns models, en ser advertits que es tracta d'una prova de desenvolupament, comencen a llançar potències de 2 (com 64) o resultats basats en simulacions matemàtiques, però continuen sense assolir una veritable entropia.

Això és un recordatori crític per a qualsevol desenvolupador. Si el teu sistema depèn d'una generació de nombres aleatoris segura, mai utilitzis una IA. En el seu lloc, recorre a llibreries estàndard de javascript com crypto.randomInt(1, 101). Confiar l'entropia a un model de llenguatge és un error d'arquitectura que pot comprometre la seguretat de les teves aplicacions, de la mateixa manera que ignorar els riscos en Tus Pipelines CI/CD: La Mayor Superficie de Ataque No Vigilada.

La il·lusió de la neutralitat

Fins i tot en sol·licitar explícitament que evitin biaixos, els models lluiten contra la seva pròpia naturalesa. Els seus processos de pensament mostren com descarten opcions per considerar-les «massa notables» o «massa humanes», la qual cosa és, en si mateix, un biaix.

Conclusió

Els models de llenguatge són miralls. Quan una IA tria un nombre, no està realitzant una operació matemàtica complexa d'aleatorietat, sinó executant un argmax sobre una distribució de probabilitat carregada de cultura pop i argot d'open source. Entendre això és fonamental per a qualsevol professional que integri IA en el seu flux de treball, ja que ens permet diferenciar entre una eina de raonament lògic i un predictor de llenguatge estadístic.

Font: Dev.to

La IA i el mite de l'aleatorietat: Què revela el teu model de llenguatge?

L'experiment: Per què les IA sempre trien el mateix nombre?

Biaixos en la programació i l'entrenament

El parany de l'aleatorietat en el desenvolupament

La il·lusió de la neutralitat

Conclusió

Articles relacionats

Controla els teus costos de programació IA: L'auge de la monitorització

Control Your AI Programming Costs: The Rise of Monitoring

Controla tus costes de programación IA: El auge de la monitorización

Arquitectura de sincronització: Kotlin, Jetpack Compose i Spring Boot

Comentaris

Tens alguna cosa a dir-nos?

Gràcies pel teu missatge!