Codificación IA

Utilice Codificación IA para generar automáticamente códigos inductivos para sus datos de texto.

¿Qué es la codificación IA?

ATLAS.ti se enorgullece de ofrecer Codificación IA, la primera de muchas características verdaderamente automatizadas, impulsadas por los modelos GPT líderes en el mundo de OpenAI. 

Codificación IA le ayuda a usted, el investigador, "leyendo" sus documentos y realizando una codificación descriptiva totalmente automatizada. Por supuesto, puede revisar y refinar los códigos que se generan para adaptarlos a su investigación, pero puede ahorrarle un tiempo valioso procesando sus datos y realizando la tarea servil de la codificación inicial por usted. El tiempo que se ahorra puede utilizarse para refinar y combinar códigos, realizar análisis y producir visualizaciones al informar sobre la investigación.

Tenga en cuenta que la Codificación IA es una función beta. Puede utilizarla libremente y agradeceremos sus comentarios sobre cualquier aspecto de la misma.

¿Cómo funciona la codificación por IA?

1. Seleccione su(s) documento(s) de texto

Para analizar varios documentos de texto, seleccione los documentos en el Administrador de documentos. A continuación, haga clic en los tres puntos de la parte inferior de la página, seleccione "Herramientas" y seleccione "Codificación IA". Para analizar un solo documento, también puede abrir cualquier documento y hacer clic en "Herramientas" y, a continuación, en "Codificación IA".

2. Iniciar la codificación IA 

Después de hacer clic en "Empezar Codificación IA", ATLAS.ti le preguntará si quiere continuar y le mostrará una estimación aproximada del tiempo que tardará en procesar sus datos.

Codificación IA subirá el contenido de su documento a los servidores de ATLAS.ti y OpenAI. Nunca subiremos sus datos sin su consentimiento explícito. Si desea continuar, active la casilla donde reconoce que está de acuerdo con nuestro EULA y Política de Privacidad. OpenAI NO utilizará los datos de los usuarios de ATLAS.ti para entrenar los modelos de OpenAI.


3. Revisar los resultados

Después de que la Codificación IA haya terminado, ATLAS.ti le presentará una visión general de los resultados. Puede hacer clic en "Crear citas".

Para revisar fácilmente sus resultados, le recomendamos que haga clic en "Guardar como View" para guardar una vista de los resultados de la Codificación IA. Esta vista incluirá la fecha, hora y todos los códigos creados y sus citas asociadas. Siempre puede acceder a esta vista desde su página View, y esta vista también le facilita revisar las codificaciones y hacer las ediciones necesarias (por ejemplo, agregar/eliminar códigos, renombrar códigos, combinar códigos en el Administrador de Códigos, etc.).


Cómo sacar el Máximo Partido de la Codificación IA

  • Es mejor enviar documentos que pertenezcan juntos temáticamente en la misma ronda de Codificación IA. Esto mejorará la calidad de la codificación y permitirá a ATLAS.ti ignorar patrones repetitivos en los documentos, como las preguntas de las entrevistas.
  • La codificación IA funciona por párrafos. Para obtener mejores resultados, las preguntas de las entrevistas o los nombres de los participantes en las transcripciones deben ir en su propio párrafo, y la estructura de párrafos de un documento debe estar bien definida. Al editar el documento, utilice los números del margen izquierdo para determinar la separación entre párrafos.
  • Los documentos PDF no contienen párrafos, aunque lo parezcan, por lo que los resultados de los documentos PDF serán probablemente pobres.
  • Codificación IA omite párrafos muy cortos.
  • Codificación IA sólo examina el texto sin formato de sus documentos. Los códigos, citas y formatos existentes no influyen en los resultados.

Codificación IA en profundidad

Codificación IA trabaja con la familia GPT de grandes modelos lingüísticos. Estos modelos se basan en grandes cantidades de textos diferentes y en la formación adicional de investigadores humanos, lo que permite utilizarlos de forma generalizada.

Nosotros en ATLAS.ti ofrecemos un acceso fácil a estos modelos capaces con nuestra característica de Codificación IA sin la necesidad de entender y navegar por los detalles técnicos y las limitaciones. ATLAS.ti divide automáticamente su texto en trozos que son manejados por la IA y los pasa a los modelos GPT para un análisis repetido. Los resultados del análisis se combinan algorítmicamente para ofrecer la mejor mezcla de códigos que cubren diferentes temas sin producir una cantidad abrumadora de códigos.

He aquí una visión en profundidad de estos pasos:

Los grandes modelos lingüísticos son sensibles al texto circundante, ya que disponen de una ventana de atención, también llamada contexto. Elegir el contexto adecuado es clave para trabajar con un modelo lingüístico de gran tamaño. Un contexto corto puede significar que no se pueda procesar mucha información, porque algunas palabras o incluso frases sólo tienen sentido en un contexto más amplio. Elegir un contexto demasiado grande desborda el modelo con información y hace más difícil para los algoritmos de extracción de código encontrar códigos significativos. ATLAS.ti elige contextos que no tienen menos de 100 caracteres de longitud, pero que se rompen en los límites naturales de los párrafos. Descubrimos que estos límites tienen un impacto positivo en la calidad de la codificación, a la vez que dejan fuera la mayoría de los encabezamientos y títulos, que son de menor importancia para los investigadores cualitativos. Como paso adicional para reducir el ruido en los datos analizados, ATLAS.ti elimina del análisis los párrafos que aparecen más de una vez, ya que es probable que se trate de frases recurrentes de entrevistas o nombres de hablantes.

En el primer paso del análisis, los modelos de IA se encargan de encontrar codificaciones significativas para cada segmento de datos, actuando como si el modelo fuera un asistente de investigación cualitativa. Como los modelos de la familia GPT son bastante creativos, la codificación IA puede producir codificaciones similares, mientras que otras tocan el mismo tema pero se expresan de formas disímiles. Este procedimiento puede producir cientos de códigos diferentes que no son manejables de forma que se ahorre tiempo.

Para solucionarlo, utilizamos una característica de los modelos lingüísticos llamada incrustación, en la que cada palabra o frase puede asociarse a un punto en un espacio multidimensional. Una de las propiedades útiles de esta característica es que las palabras y frases más parecidas entre sí se sitúan más cerca unas de otras que las palabras o frases menos parecidas. Aprovechando esta propiedad, ATLAS.ti agrupa los códigos combinando los más cercanos entre sí en una colección. Esta agrupación se repite hasta que se alcanza un número satisfactorio de colecciones.

Los códigos combinados se asocian a los segmentos generados y se proponen en la interfaz de ATLAS.ti para ver las citas.

Tenga en cuenta que, aunque en general es beneficioso que los modelos GPT se hayan entrenado con grandes cantidades de texto, en algunas situaciones esto puede dar lugar a resultados incorrectos que no reflejen con exactitud personas, lugares o hechos reales. En algunos casos, los modelos GPT pueden codificar sesgos sociales como estereotipos o sentimientos negativos hacia determinados grupos. Deberá evaluar la exactitud de los resultados en función de su caso de uso.