Novedades y alucinaciones de LLM

En los viajes espaciales no es raro que vaya un equipo por duplicado. Asi que si uno falla se hace una prueba y se pasa al secundario,  Por mi trabajo he tenido que estar haciendo pruebas y a veces pregunto temas medianamente complejos para evaluar que sucede, y una buena parte de las llm es basura. He estado probando llama, Gemini, Claude y GPT. Ninguna ha podido resolver un problema técnico real de sistemas que he estado viendo con un codigo de java que pase a c# pero no consigo pasar a php porque es un cifrado rijdael mal hecho por terceros, en arreglos de cadena nula de bytes sobre una versión de java desconocida en 2017 con varias fallas de fondo y forma.

He visto, eso si, que Gemini es bueno en ciertas cosas pero le he encontrado varias alucinaciones (respuestas erroneas) que van de medicina a errores de matematicas simples otros temas. Sirve como segunda opinión pero  tiene algunas ventajas menores que no comento aqui, y su enfoque no es malo pero al mismo tiempo es incompleto.

Hoy me encontré con un problema complejo matematico en un correo que me mandaron sobre costos de produccion. Asi que en vez de meterlo a excel probe usarlo en Gemini y el resultado fue error en los numeros. Literalmente las formulas eran medianamente acertadas pero lo demas no. Su aplicacion estaba mal. Lo hice en hoja de excel.

Luego me tocó ver una tarea de universidad (acabo de recibir dos dieces mas) y la tarea igual bastante complicada. Mapas conceptuales imposibles que estan pensados para no inteligencia artificial, y dos o tres problemas que no se si eran pregunta capciosa. Seguro que nadie de mis compañeros vio lo del os mapas conceptuales ni lo de la tarea de pregunta capciosa, y una u otra cosa se equivocaron.

Que mas… :

  • La dama Margarita anda de mejor humor y ya puso foto de perfil o me quitó de su bloqueo sea lo que haya sido.
  • La mayoria del trabajo estan en problemas de dinero por la falta de pago.
  • Mi jefa inmediata dice que ya sacaron el respaldo de php 5.6 de los ocho anos anteriores . Mi grafica de uso idce que no han respaldado los 15 gb pero no pienso seguir pagando ese servidor especifico por un esperpento de laravel 5.2 que era una tarea de un estudiante universitario mal hecho de 2017. Asi que en 30 dias eliminaré el servidor y sobre aviso no hay engaño. Segun yo van a perder todo el histórico.
  • Ya tengo listo el documento para el juzgado; mi hija menor cumple 18 años pronto y hay que meter un documento para que si su mama trata de reactivar el juicio civil del que nunca se pudo notificarle, ya no proceda por la mayoría de edad. Por cierto que tengo que rehacer testamento.
  • Estaba en la casa sentado en un sillon. Me ve la gatita de ojos verdes, le hago un gesto para que se suba al sillon, no verbal y el que responde es el perro nuevo saliendo como bolido de su area cruzando cuatro metros en tres zancadas y me cayó encima con toda su perrunidad. Que barbaro. Brincó la barrera perruna, es obediente y cariñoso pero es una bestia.