Etiqueta: evaluación

Valoraciones 5 estrellas: ¿podemos fiarnos de las reseñas?

Cada vez compramos más habitualmente en internet. Cuando lo hacemos, muchas veces adquirimos un producto sin poder evaluar su calidad. Debido a ello, las reseñas han adquirido cada vez más importancia. Estas reseñas suelen ser una valoración (por ejemplo, de 1 a 5) que, en ocasiones, va acompañada de un texto e incluso fotos y vídeos en los cuales se puede observar el producto en funcionamiento.

Ya hay numerosos estudios que demuestran la relación entre estas reseñas y las ventas de productos. Los productos mejor valorados venden más y a mayor precio. Ante esta situación, una cuestión fundamental es si podemos fiarnos de esas valoraciones. A medida que su importancia es cada vez mayor, han surgido distintos esquemas y modelos para intentar escorar las valoraciones de forma artificial.

Inicialmente, alrededor del año 2010, el modelo consistía en introducir valoraciones falsas, positivas o negativas. Las positivas se hacían por parte de la misma empresa, mientras que las negativas, por parte de sus competidores. Este esquema fue resuelto parcialmente por algunas plataformas permitiendo que solo pudieran valorar aquellos usuarios que hubieran comprado el producto. Así, TripAdvisor permite que cualquiera valore un hotel, mientras que Booking.com solo permite que aquellos que han reservado en su plataforma puedan valorar. Google, al igual que TripAdvisor, no exige prueba fehaciente de haber experimentado un servicio para permitir poner una valoración del mismo.

Presionar a los clientes para que valoren

Posteriormente, el sistema se sofisticó ligeramente. Así, las empresas incitaban a los consumidores que sabían que estaban satisfechos a que pusieran una valoración. Como mecanismo no se puede considerar que sea fraudulento, ya que solo se busca incentivar a determinados perfiles de clientes a valorar.

A su vez, en los últimos años asistimos a modelos mucho más agresivos y sistemáticos, perfectamente dirigidos y con campañas orquestadas a lograr un gran número de valoraciones en uno u otro sentido. Especialmente famoso resultó el caso de marcas chinas bien reconocidas en Europa: Amazon descubrió que sus buenas valoraciones se debían a granjas de servidores que generaban las valoraciones de forma automatizada. Muchos de estos productos han sido expulsados de Amazon, que ha prohibido su venta.

Por otro lado, en un artículo publicado en 2020 sobre Airbnb explicábamos que, cuando hay contacto directo entre comprador y vendedor (por ejemplo, en Airbnb), el tema es aún más complejo. Para evitar perjudicar a la persona que nos ha alojado en su domicilio, tendemos a autocensurarnos y a tener especial cuidado con lo que decimos.

Nuevos modelos

Adicionalmente, en los últimos tiempos han comenzados a aparecer nuevos sistemas para forzar una buena valoración. Por ejemplo, carteles para poner en la nevera de propiedades que se alquilan en Airbnb. En estos carteles se deja claro al huésped que la valoración debe ser perfecta, de 5 estrellas. Cualquier otra valoración indicaría que la estancia ha sido poco menos que un desastre.

Hace poco tiempo tuvimos constancia de un sistema mucho más sutil aún y que afecta a una de las plataformas que había siempre presumido de ser inmune a este tipo de críticas, Booking.com. Al poco de hacer el check-out, el cliente recibe la solicitud de Booking.com para que valore su estancia. Una vez que la hace, y antes de publicarla, Booking.com avisa al hotel.

Si la valoración no es perfecta, hay casos en los que el hotel se pone en contacto con el cliente mostrando un aparente interés sincero por aquello que pueda haber ido mal solicitándole que, por favor, cambie la valoración. En concreto, un mensaje recibido por un cliente que reservó usando Booking.com es el siguiente:

Buenos días, (NOMBRE DEL CLIENTE). Soy la recepcionista del (NOMBRE DEL ALOJAMIENTO). Hemos recibido su valoración por Booking.

¿Pasó algo malo durante su estancia?

A lo mejor fue un error, pero la nota final es un 8 (😭). Esta evaluación no refleja todo el trabajo que hacemos a diario.

Y la nota que hemos recibido perjudica mucho a todo el equipo.

Si usted es tan amable y puede modificar o eliminar su puntuación (🙏). Por favor. Perdón por molestarle y gracias.

Tecnología blockchain para detectar falsas valoraciones

En resumen, cada vez empieza a ser más complicado fiarse de las valoraciones online. Ante esta situación, la tecnología blockchain podría ayudar a resolver algunos de los problemas mencionados anteriormente, tal y como explicamos en un estudio publicado recientemente, Fighting fake reviews with blockchain-enabled consumer-generated reviews.

Con el sistema que proponemos en el artículo, sería relativamente sencillo detectar gran parte de los problemas anteriormente citados. Por ejemplo, seguiría siendo posible modificar una valoración, pero en el blockchain quedarían ambas valoraciones, la original y la modificada.

Estadísticamente, se podrían detectar patrones anómalos en las valoraciones y, sobre todo, la base de datos de valoraciones no estaría en manos de ninguna empresa con intereses en las valoraciones, sino que serían independientes y disponibles para distintas iniciativas que se pudieran desarrollar en torno a las mismas.

En todo caso, lo que cada vez queda más claro es que cualquier tecnología o modelo que imaginemos estará siempre supeditada a la imaginación humana, que siempre será capaz de encontrar nuevas formas de engañar al sistema que se diseñe.

Jacques Bulchand Gidumal, Profesor de Emprendimiento y Turismo Digital, Universidad de Las Palmas de Gran Canaria

Este artículo fue publicado originalmente en The Conversation. Lea el original.

octubre 4, 2023
¿Por qué lo llaman estadística cuando quieren decir sesgo?

¿Recuerdan ese chiste en el que una persona busca bajo una farola las llaves que se le extraviaron en un callejón oscuro, simplemente porque la tarea es más fácil con luz? Pues todos hacemos un poco lo mismo en algún momento. Y los científicos, que no son ajenos a las debilidades humanas, también. La estadística, una de las ciencias más útiles y rigurosas, ha servido en inolvidables ocasiones para argumentar debilidades, incluso desvaríos. Y es que a veces, guiados por nuestros propios sesgos, los científicos tendemos a fijarnos en los hechos más llamativos o en aquellos relacionados con nuestra experiencia personal, en lugar de ver en los datos relaciones indirectas o inesperadas. Y por esta razón, el sesgo de quien interpreta los datos puede producir fenómenos para reír, o para echarse a llorar.

Por ejemplo, llevados por sus sesgos, algunos científicos interpretaron que la formación de las mujeres era contraproducente para cuidar enfermos, o que el tamaño del pene medio en un país tenía relación con la renta per cápita.

Hoy, que no hay quien viva sin la estadística, hacemos un guiño para hablar de cuando los sesgos son, más que sesgos, auténticos faroles.

Una lectura machista de la estadística para tratar indigentes

Es célebre el caso de la enfermera Florence Nightingale cuyo diagrama de área polar (o “de la rosa”), elaborado a partir de los datos recopilados mientras prestaba servicio sanitario en la guerra de Crimea, sirvió para convencer a todo un país de que las insalubres condiciones de los hospitales de campaña podían matar más que las balas.

Sin embargo, quizás no es tan conocido el hecho de que sus estadísticas también fueron usadas para desmentir otras falsas creencias. Entre ellas la extendida por los gestores de los hospitales que atendían a indigentes en Reino Unido, que afirmaban sin pudor que los enfermos asignados a enfermeras profesionales evolucionaban peor que los atendidos por enfermeras voluntarias sin formación específica.

La tesis que realmente pretendían demostrar los médicos es que la cualificación técnica de las mujeres entorpecía su instinto natural para proporcionar cuidados. El farol que se marcaron estos señores con sus datos muy probablemente tenía que ver con la oposición social a la educación superior de las mujeres imperante en la época.

Sea como fuere, los números de Nightingale demostraban que lo que ocurría en realidad era que los heridos más graves –y por tanto con peor pronóstico– eran usualmente asignados a enfermeras de carrera.

Este es un ejemplo de lo que se conoce como paradoja de Simpson, que viene a decir que la forma en que agregamos los datos tiene mucho que ver con la lectura que queramos hacer de ellos: obviamente no es lo mismo calcular la mortalidad de los pacientes en función de la cualificación de las enfermeras que los atienden que según la gravedad inicial de sus dolencias.

Los hombres calvos y la covid-19 aguda

En junio de 2020, la revista Forbes publicó las sorprendentes conclusiones de un estudio según el cual “los hombres calvos tenían un riesgo más alto de sufrir covid-19 aguda”.

Mika Baumeister/Unsplash

Poco tiempo después, Forbes se vio obligada a rectificar apuntando que el estudio no había tenido en cuenta la edad de los participantes, que resulta ser un factor de riesgo tanto para sufrir covid-19 aguda como para perder el pelo.

Durante la pandemia, la avidez de noticias y la falta de pericia estadística impidió en muchas ocasiones identificar los auténticos factores causales de las conclusiones ofrecidas por algunas investigaciones que iban de farol, a lo grande.

El tamaño del pene y la renta per cápita

El economista Tatu Westling, de la Universidad de Helsinki (Finlandia), publicó en 2012 un artículo titulado “Órgano masculino y crecimiento económico: ¿el tamaño importa?”.

Aunque a priori el tema no parece dar de sí más que para una tertulia de televisión sensacionalista, lo cierto es que el análisis fue publicado en una revista científica y defendido con entusiasmo por su autor (e incluso por alguno de los editores) en varios eventos posteriores.

Para llevarlo a cabo, el doctor Westling cruzó datos de la renta per cápita de 121 países entre 1960 y 1985 con el tamaño del pene de los varones de esas naciones (por lo visto existe una exhaustiva base de datos al respecto, no nos pregunten quién la financió ni por qué lo hizo).

Buscando correlaciones entre ambas variables dijo haber encontrado una significativa para 76 de esos países en el año 1985. Sus conclusiones se resumen en la siguiente gráfica publicada en el artículo: en el eje vertical se indica la renta per cápita en miles de dólares, y en el horizontal la dotación genital de los señores expresada en cm.

Grafica que correlaciona el tamaño medio del pene en distintos países con la renta per cápita.
Tatu Westling, Universidad de Helsinki, CC BY

Si se observa la disposición de los países en la gráfica, se comprueba que el cuadrante inferior izquierdo está ocupado mayoritariamente por países asiáticos, y el inferior derecho por países africanos. Así que, pásmense, el autor dice encontrar una correlación cuadrática entre ambas variables.

En otras palabras, afirma que esa U-invertida es “un buen resumen” de los datos recogidos. Incluso postula, “aunque con reservas”, que el tamaño del órgano masculino resulta ser un mejor predictor de la evolución del PIB que el régimen político del país en cuestión. ¡Con un par (de p-valores)!

No sé si estarán de acuerdo, pero para encontrar un patrón en esa maraña de puntos hay que tener mucha fe en la testosterona. Sin embargo, el autor se atreve a sugerir, además, relación causal basada en el siguiente razonamiento: un mayor tamaño genital implica un mayor nivel de testosterona y, consecuentemente, menor aversión al riesgo y, por tanto, mayor iniciativa empresarial.

Dejando de lado el hecho de que el autor desestima la influencia en la economía de la mitad de la población –la que carece de genitales externos medibles–, apliquemos el principio de contraposición lógica a este razonamiento. Si mayor tamaño implica mayor crecimiento económico, ¿significa eso que una época de recesión tiene como consecuencia una inesperada merma biológica? ¡Como si les hiciera falta más presión a los ministros de economía!

Todos, también los científicos, estamos sometidos a la tiranía de nuestras “farolas” particulares, que nos guían y nos ciegan a la vez. Pero el método científico y el buen uso de la estadística vienen a rescatarnos de los sesgos cognitivos inherentes al ser humano.

No olvidemos que, citando a unos grandes pensadores del siglo XX:

“Somos seres racionales… de los que toman raciones en los bares” (Siniestro Total dixit).

Jose Manuel Rodriguez, Full Professor of Mathematics, Universidad Carlos III; Ana Granados, Profesora de matemáticas, Saint Louis University y Ana Portilla Ferreira, Profesora de Matemáticas, Saint Louis University

Este artículo fue publicado originalmente en The Conversation. Lea el original.

agosto 17, 2023

Etiqueta: evaluación

Valoraciones 5 estrellas: ¿podemos fiarnos de las reseñas?

¿Por qué lo llaman estadística cuando quieren decir sesgo?