Excel contra la ciencia, ¿a que no lo habrías imaginado?

Es normal, al hablar de investigación científica, pensar en documentos de Excel llenos a reventar de números, fórmulas, más números, alguna fórmula más y, si tenemos mucha suerte, algún ajuste de formato que facilite la lectura de la información contenida en el documento. ¿Gráficos? Son solo para los débiles de espíritu. ¿Ilustraciones? ¿Elementos gráficos en Word Art? ¿Textos comprensibles por el común de los mortales? Claro, se empieza así y se termina haciendo un tebeo de Mortadelo y Filemón…

Bueno, bromas aparte, sí que es cierto que Excel, y los libros de cálculo, son una herramienta singularmente valiosa para la investigación científica, puesto que no solo permiten recopilar una gran cantidad de información, ajustando la organización de la misma a las necesidades concretas de cada caso, sino que además permiten relacionarla entre sí y, gracias a las fórmulas, hacer que dichas relaciones se reflejen y actualicen automáticamente al realizar cualquier cambio. No es de extrañar que fueran las hojas de cálculo las «responsables» de que la informática se colara en empresas y oficinas de todo tipo, en los lejanos y entrañables años ochenta del siglo pasado.

Sin embargo, y aunque como digo, las hojas de cálculo son una excelente herramienta, también tienen algunos puntos negativos, y hoy leo en Übergizmo un ejemplo de ello que, al mismo tiempo, reconozco de inmediato y me sorprende sobremanera. Y es que, por lo que veo, la costumbre de Excel de intentar interpretar la información que se introduce en cada celda, con el fin de darle el formato adecuado, podría estar suponiendo un problema para los investigadores.

¿Y en qué consiste el problema con Excel, y que ya fue abordado por un equipo de investigadores allá por 2016? Pues pongamos un ejemplo básico: imagina que se están tomando datos de, por ejemplo, varias muestras de experimentos realizados durante el mes de marzo. No vamos a pedir al investigador que, además, sea un literato de pro, por lo que es posible que los nombres que ponga para identificar los resultados sean algo así:

  • Marzo-1
  • Marzo-2
  • Marzo-3
  • Marzo-N

El problema es que Excel, al ver dichas entradas, probablemente las interpretará como fechas, y cuando la persona que ha añadido los datos, o cualquier otra persona con acceso al documento, se ponga a revisarlo, lo que se encontrará es algo como:

  • 1 de Marzo de 2020
  • 01/03/2020

Es decir, datos que son de texto, son interpretados por Excel como fechas y, por lo tanto, les aplica el formato que considera adecuado. Esto también puede ocurrir con datos numéricos que, en apariencia, son fechas, pero que en realidad no lo son. Por ejemplo, cualquier persona que tenga un libro en el que lleve el control de sus facturas, y las nombre con un número y el año, algo como 04/2020, lo que se puede encontrar es que Excel lo sustituye por «Abril de 2020».

Y hay que tener en cuenta, claro, que hablamos de documentos en los que, de manera general, no se guardan unas decenas o cientos de entradas. No, generalmente hablamos de un volumen muy superior, por lo que una revisión manual de los mismos puede llevar mucho tiempo y, además, deja margen al error, especialmente si la revisión es efectuada por la misma persona que añadió los datos en el libro de Excel.

Y no es un problema menor, es más, llega al punto de que entidades como HUGO, el comité que trabaja en la asignación de nombres a los genes del ser humano, ha tenido que publicar un conjunto de pautas para dicha tarea. Reglas que nacen, precisamente, como resultado de los posibles efectos negativos que puede tener la función de autoformato de fechas de Excel. Un conjunto  de reglas que no solo se deben emplear a futuro, sino que también se deben aplicar de manera retroactiva a todos los genes que ya han recibido un nombre que pueda ser malinterpretado por Excel.

Sería interesante que Excel pudiera configurarse para, por defecto y en todos los documentos, Excel no aplique formatos a los datos que se introducen en una hoja y que pueden ser malinterpretados. Pero, hasta que llegue esa opción, si es que lo hace (y esperemos que sí, ya sabemos que Excel es la niña mimada de Nadella), la mejor posibilidad es detener el formato automático de números y su cambio por fechas. Microsoft explica cómo hacerlo aquí. Y si prefieres esperar a que Microsoft active dicha función, siempre puedes hacer tiempo jugando unas partidas de X-COM en Excel. Así, aunque tarde en llegar, al menos estarás entretenido.

La entrada Excel contra la ciencia, ¿a que no lo habrías imaginado? es original de MuyComputer