Web Analytics
Avisos
Vaciar todo

¡Bienvenido a zonaia 😀!


Un foro de ayuda para aprender a crear chatbots.


Aprende ManyChat, Chatfuel y Dialogflow.


¡No esperes más y únete a nosotros hoy!


Aprendizaje automático con Python - Técnicas  

 

Leonardo Mayorga
(@admin)
Miembro Admin
Registrado: hace 2 años
Respuestas: 474
25/09/2018 9:58 pm  

Este capítulo analiza cada una de las técnicas utilizadas en el aprendizaje automático en detalle.

Clasificación

La clasificación es una técnica de aprendizaje automático que utiliza datos conocidos para determinar cómo se deben clasificar los nuevos datos en un conjunto de categorías existentes.

Considere los siguientes ejemplos para comprender la técnica de clasificación:

Una compañía de tarjetas de crédito recibe decenas de miles de solicitudes de nuevas tarjetas de crédito. Estas aplicaciones contienen información sobre varias características diferentes como edad, ubicación, sexo, salario anual, historial créditicio, etc. La tarea del algoritmo aquí es clasificar a los solicitantes de tarjetas en categorías como aquellos que tienen un buen historial de crédito, historial de crédito malo y aquellos que tener un historial de crédito mixto.

En un hospital, la sala de emergencias tiene más de 15 características (edad, presión arterial, problemas cardíacos, gravedad de la dolencia, etc.) para analizar antes de decidir si un paciente determinado debe ingresar a una unidad de cuidados intensivos, ya que es una propuesta costosa. y solo aquellos pacientes que pueden sobrevivir y pagar el costo reciben la máxima prioridad. El problema aquí es clasificar a los pacientes en pacientes de alto y bajo riesgo según las características o parámetros disponibles.

Al clasificar un conjunto de datos, el sistema clasificador realiza las siguientes acciones:

  • Inicialmente, se prepara un nuevo modelo de datos utilizando cualquiera de los algoritmos de aprendizaje.
  • Luego se prueba el modelo de datos preparados.
  • Más tarde, este modelo de datos se usa para examinar los datos nuevos y determinar su clase.

La clasificación, también llamada categorización, es una técnica de aprendizaje automático que utiliza datos conocidos para determinar cómo deben clasificarse los nuevos datos en un conjunto de etiquetas/clases/categorías existentes.

En tareas de clasificación, el programa debe aprender a predecir valores discretos para las variables dependientes o de salida de una o más variables independientes o de entrada. Es decir, el programa debe predecir la clase, categoría o etiqueta más probable para nuevas observaciones. Las aplicaciones de clasificación incluyen la predicción de si un día lloverá o no, o la predicción de si el precio de la acción de una determinada compañía aumentará o disminuirá, o si un artículo pertenece a la sección de deportes o entretenimiento.

La clasificación es una forma de aprendizaje supervisado. Los proveedores de servicios de correo como Gmail, Yahoo y otros utilizan esta técnica para clasificar un correo nuevo como correo no deseado o no. El algoritmo de clasificación se entrena analizando el comportamiento del usuario al marcar ciertos correos como spam. En función de esa información, el clasificador decide si un nuevo correo debe ir a la bandeja de entrada o a la carpeta de correo no deseado.

Aplicaciones de clasificación

  • Detección de fraude con tarjeta de crédito: el método de clasificación se usa para predecir fraudes de tarjetas de crédito. Empleando registros históricos de fraudes anteriores, el clasificador puede predecir qué transacciones futuras pueden convertirse en fraudes.
  • Correo electrónico no deseado: según las características de los correos no deseados anteriores, el clasificador determina si un correo electrónico recién recibido debe enviarse a la carpeta de correo no deseado.

Técnica de clasificador Naive Bayes

Las técnicas de clasificación incluyen Naive Bayes Classifier, que es una técnica simple para construir clasificadores. No es un algoritmo para entrenar tales clasificadores, sino un grupo de algoritmos. Un clasificador de Naive Bayes construye modelos para clasificar instancias de problemas. Estas clasificaciones se hacen usando los datos disponibles.

Una característica importante del clasificador de Naive Bayes ingenuo es que solo requiere una pequeña cantidad de datos de entrenamiento para estimar los parámetros necesarios para la clasificación. Para algunos tipos de modelos, los clasificadores Naive Bayes ingenuos pueden ser entrenados de manera muy eficiente en un entorno de aprendizaje supervisado.

A pesar de sus suposiciones simplificadas, los clasificadores ingenuos de Naive Bayes han trabajado eficientemente en muchas situaciones complejas del mundo real. Estos han funcionado bien en el filtrado de spam y la clasificación de documentos.

Regresión

En regresión, el programa predice el valor de una salida continua o variable de respuesta. Los ejemplos de problemas de regresión incluyen la predicción de las ventas de un nuevo producto o el salario de un trabajo según su descripción. Similar a la clasificación, los problemas de regresión requieren un aprendizaje supervisado. En las tareas de regresión, el programa predice el valor de una salida continua o variable de respuesta a partir de las variables de entrada o explicativas.

Recomendación

La recomendación es un método popular que proporciona recomendaciones cercanas basadas en la información del usuario, como el historial de compras, los clics y las calificaciones. Google y Amazon usan este método para mostrar una lista de artículos recomendados para sus usuarios, basados ​​en la información de sus acciones pasadas. Hay motores de recomendación que funcionan en segundo plano para capturar el comportamiento del usuario y recomendar elementos seleccionados en función de acciones de usuario anteriores. Facebook también usa el método de recomendación para identificar y recomendar personas y enviar sugerencias de amigos a sus usuarios.

Un motor de recomendación es un modelo que predice en qué puede estar interesado un usuario en función de su historial y comportamiento anterior. Cuando esto se aplica en el contexto de las películas, se convierte en un motor de recomendación de películas. Filtramos elementos en la base de datos de películas prediciendo cómo un usuario puede calificarlos. Esto nos ayuda a conectar a los usuarios con el contenido correcto de la base de datos de películas. Esta técnica es útil de dos maneras: si tenemos una base de datos masiva de películas, el usuario puede o no encontrar contenido relevante para sus elecciones. Además, al recomendar el contenido relevante, podemos aumentar el consumo y obtener más usuarios.

Netflix, Amazon Prime y empresas similares de alquiler de películas dependen en gran medida de motores de recomendación para mantener a sus usuarios comprometidos. Los motores de recomendación generalmente producen una lista de recomendaciones usando filtros colaborativos o filtros basados ​​en el contenido. La diferencia entre los dos tipos radica en la forma en que se extraen las recomendaciones. El filtrado colaborativo construye un modelo a partir del comportamiento pasado del usuario actual, así como las calificaciones otorgadas por otros usuarios. Este modelo se usa para predecir en qué podría interesar a este usuario. El filtrado basado en contenido, por otro lado, usa las características del artículo para recomendar más elementos al usuario. La similitud entre los elementos es la principal motivación aquí. El filtrado colaborativo a menudo se usa más en dichos métodos de recomendación.

Para continuar viendo el resto de contenido por favor Crea Una Cuenta o Inicia Sesión


Citar
Compartir:
Sitio web hecho con ❤ para el mundo