Archivo de la categoría ‘Redes’

HTTPS no añade legitimidad o credibilidad a una Web, brinda seguridad

Share on Google+Share on FacebookTweet about this on Twitter

Llevo ya días que al despertarme me topo con alguna noticia relativa a HTTPS, supongo que los responsables son Mozilla y Google, que desde primeros de años decidieron aplicar algunas medidas coercitivas en sus navegadores, lo que sucede es que como siempre si el usuario medio no entiende lo que quiere decirle un cartel de advertencia, al final da igual.

 

Brevemente, sobre el mensaje “nuevo” que estas dos compañías han instaurado. Es un ejemplo más que muestra el trabajo que cuesta a veces a los usuarios de perfil medio la diferencia entre seguridad y legitimidad de una página. Muchos empezaron a decir incluso que Google iba a advertir con mensajes a los usuarios sobre que una web no era segura… no tiene nada que ver con eso, de echo tanto Firefox como Chrome muestran exactamente lo que tienen que mostrar, la lectura que otros le quieran dar es diferente:

La primera es el mensaje que muestra Firefox, el segundo Chrome, este último también traslada un mensaje en la URL. En esencia dicen exactamente lo mismo. Ambas compañías simplemente muestran en pantalla ese mensaje cuando se dan dos circunstancias: La primera, estamos en un formulario que se reconoce un campo de contraseña donde vamos a introducirla. La segunda es que la Web en cuestión en la que vamos a introducir dicha contraseña no está bajo HTTPS con un certificado válido. Dicho de otro modo, al no estar la web bajo HTTPS, los datos que pongamos tanto en la contraseña como en el nombre de usuario, es posible que sean enviados en “texto plano”, es decir, tal como los introducimos, y por ende podrían ser potencialmente interceptados por alguien que “pinchase” la conexión en cualquier punto de esta.

Hay que entenderlo, no significa que la web sea insegura realmente, o que no sea legítimas. Lo que nos avisa es que si nuestra red no es segura (nos están robando WIFI, tenemos un familiar/amigo travieso conectado a ella, usamos una red pública…), alguien podría potencialmente leer ese tráfico, y claro… a lo mejor no importa tanto saber que visitas una web concreta o incluso el contenido de ella, pero si importa y mucho si lo que capturan es la contraseña de tu correo electrónico, de acceso a un servicio. Pero repito, nada tiene que ver con legitimidad o fiabilidad, y es más, esa advertencia puede no ser importante si sabemos perfectamente desde donde nos conectamos.

 

Volviendo al asunto original del artículo, estoy aburrido de leer “noticias” sobre HTTPS, Certificados TLS/SSL, “seguridad”… y casi todos ellos sesgados. El último ha sido esta tarde… no me gusta tirar tierra a nadie y respeto el trabajo de cualquiera, pero creo que hay que ser más riguroso en lo que se escribe, y por citarlos, hablo de un artículo en Xataka. A veces una coma o el modo de decir las cosas no importa y se sobre entiende, pero otras veces el significado es muy diferente sólo con que falte un acento. En este caso, y cito textualmente encontramos el problema de siempre, algunas frases muy poco afortunadas:

“Esto quiere decir, que una dirección web en la que tengas que empezar escribiendo https:// en vez del clásico http:// será siempre mucho más segura, ya que certifica que la web visitada es legítima…”

“Chrome están empezando a señalar como inseguras todas las páginas que no lo utilicen”

No voy a valorar el resto del artículo, por supuesto dice cosas totalmente ciertas, el problema es que hay otras que no lo son.

Por un lado, sobre el comentario que se hace de Chrome, es falso, siempre he dicho que una media verdad no deja de ser una mentira, intencionada o no. Chrome NO SEÑALA las webs como inseguras cuando no están bajo HTTPS, Chrome, al igual que Firefox, lo que hacen es mostrar un aviso en el campo contraseña (y Chrome también en la URL) cuando existe un campo contraseña, y ese aviso, aunque pueda usar la palabra “insegura”, especifica bien claro a que se refiere, al envío de información cuando se rellena un formulario o cualquier otra cosa. Este aviso no aparece si dicha web carece de cualquier campo de este tipo, esté en HTTPS o no.

Sobre la primera frase, realmente es lo que me llevó a volver al blog, no por Xataka realmente, lo de ellos ha sido una noticia más haciendo alusión a eso de dar legitimidad a una web o no.

 

¿Qué es y qué no es HTTPS?

HTTPS se basa en autentificación y cifrado entre el equipo de origen, y el servidor destino, de forma bilateral (por lo general la autentificación la realiza sólo el cliente, no el servidor). Que un servidor use HTTPS para servir sus webs, poco o nada tiene que ver con que esa Web sea más segura, o que dicha web sea quien dice ser, con la única excepción de que use certificados tipo EV en todo caso (en lo relativo con la identidad, es decir legitimidad).

La necesidad de HTTPS nace precisamente de los cartelitos que ahora muestran Firefox o Chrome. Cada vez más usamos las conexiones inalámbricas, cada vez más hay desconfianza de los ISP (proveedores de internet) e incluso de los propios estados!! Quien no conoce a día de hoy los casos de Wikileaks y tantos otros. El cifrado no es algo nuevo, y creo que todos lo entendemos bien… algo que no esté cifrado no significa que no sea seguro, significa que si alguien lo intercepta lo va a poder leer.

No veamos HTTPS como un ente tan extraño, se puede simplificar enormemente, pensemos en vez de HTTPS y páginas web en una carta, en que quiero hacer llegar una carta a mi amada, y para ello no tengo más opción que dársela a un amigo para que a su vez se la entregue a ella. A nadie se le escapa el problema, incluso si pusiésemos un lacre sellado, mi amigo podría abrirla y leer el contenido, y si el contenido de la carta no usa un código secreto que sólo entendiese ella y yo, pues mi amigo se enteraría de todo. En función de la relevancia de las letras que ponga en esa carta, usar un código secreto entre los dos puede ser simplemente un juego, a ser totalmente necesario.

En Internet, el amigo puede ser tu hermano conectado a tu misma red, puede ser un vecino que te roba WIFI, puede ser un desconocido conectado a la misma red pública (WIFI o cable), puede ser incluso si quisiese tu ISP, por supuesto el gobierno… y eso sin contar absolutamente cualquier punto por el que tus datos son transferidos hasta llegar al servidor final. Al margen de conspiraónicos y que los gobiernos y los ISP nos espíen, el principal problema no son ellos, son las redes en las que nos conectamos. Puede que no me haga gracia que, en caso de hacerlo, un gobierno quiera interceptar mis comunicaciones, pero a fin de cuentas tampoco tengo nada que considere “personal” para ellos, más me preocupa que desconocidos puedan conocer mis datos personales, cuentas y otros.

 Sí, el cifrado puede ser algo positivo, pero desde luego desde mi punto de vista indispensable cuando manejamos información personal o evidentemente confidencial, y HTTPS soluciona esto. Ya hablé en su día largo y tendido sobre ello en uno de mis artículos, y recientemente también en el de Let’s Encrypt, donde por encima explicaba todo esto, aunque en menor medida.

Inicialmente hablaba de legitimidad… HTTPS trata sobre cifrado de datos, no sobre legitimidad. Sí, el servidor se autentifica/identifica de cara al usuario, pero no para certificar que el contenido de la página es legítimo, ni siquiera que la propia web lo sea!! Lo que certifica en todo caso (de tener un certificado digital reconocido y excluyendo los certificados EV que veremos luego) es que dicho certificado fue emitido para dicho dominio específicamente, nada más. Dicho de otro modo, que el certificado que nos llegue a nuestro equipo, poder ser validado para estar seguros que quien nos los mandó es la web que tenemos delante.

Y en ese párrafo está toda la madre del cordero. Xataka dice que certifica que la web que tenemos delante es legítima… no es cierto, la web puede decir que es Paypal, la web puede ser un calco perfecto de cualquier página de un banco, e incluso podrían tener un dominio similar!! y por supuesto, podrían usar perfectamente un certificado digital (y usar HTTPS) validado. Evidentemente a mi modo de ver las cosas, no considero eso como una web legítima. Esto es algo que se está empezando a hacer de forma masiva, por la falsa creencia precisamente del usuario de creer que si ve el candado verde la web es fiable, y es un error de base. Sí, la comunicación con dicha web se hace de forma cifrada y ningún vecino nos intercepta la comunicación, pero los datos que enviamos llegan igualmente al servidor, y si esa web la hace una persona malintencionada, evidentemente tiene acceso a dichos datos, datos que nos acaba de robar por creer nosotros que por tener candadito verde la web era legítima de fiar.

Pero por supuesto, que son unas letras sin una buena imagen. Ni siquiera he tenido que invertir tiempo en hacer una prueba propia sobre esto, simplemente me ha bastado con  mirar en cualquiera de los servidores usados para los registros de transparencia de certificados (por ejemplo https://crt.sh), que registran los certificados emitidos por las diferentes agencias CA que los usan, y mirar los dominios para los cuales se registran. Yo he buscado por Paypal, que contengan los dominios “Paypal”, por ejemplo, y el primer certificado que he encontrado que contenía su nombre ha sido el que pongo ahora en la imagen:

Antes de terminar de escribir este artículo, habré reportado dicha web, con lo que es posible que si alguien intenta acceder Google SafeBrowser la esté ya indicando como página de Phising, pero ahora mismo esta totalmente operativa. Como podemos ver perfectamente, la web está protegida por HTTPS, con su candadito verde, su “Es seguro”, con una URL similar a alguna que pueda tener una página real de Paypal, y por supuesto su contenido un calco. Bien, este es un ejemplo sencillo, poco o nada tiene que ver con que esté bajo HTTPS y el certificado sea válido, el contenido puede ser totalmente fraudulento. Ni que decir tiene que posiblemente de meter ahí los datos, se los enviaríamos a una personal mal intencionada, pero muchos creerían que como la URL parece ser “buena”, y que pone “es seguro”, es de fiar. ERROR!!

 

Let’s Encrypt, el CA del que ya hemos hablado en otra ocasión, está siendo foco de grandes críticas por muchos (no hace falta ser un genio para saber que la mayoría de todas ellas por no decir todas vienen de los otros CA). Se les acusa de emitir certificados fraudulentos. Bien, primero tendríamos que matizar que es un certificado fraudulento, porque el ejemplo que he puesto anterior de Paypal, no es un certificado fraudulento, es un certificado totalmente legítimo, lo que no es legítimo y lo que es fraudulento es el contenido de la web mostrada, así como el uso evidentemente de la propiedad intelectual de Paypal y la suplantación de identidad. El certificado es legítimo siempre y cuando quien lo solicitó demostrase que era el dueño de dicho dominio, y recordemos que el dominio no es Paypal.com, el dominio comprado en este caso es “paypal-secure-info.gq”. Dado que las normativas sobre dominio permiten el registro de dicho dominio (lo cual es normal, no pueden vetar un dominio simplemente porque contenga una palabra que es marca comercial), sería totalmente injusto vetar la emisión de un certificado para dicho dominio. El problema no es el dominio, el problema no es el certificado… el problema es el uso que se haga de ello.

Algunos dicen que Let’s Encrypt en la “poca” vida que llevan, ya ha emitido muchísimos más certificados de este tipo que llaman “fraudulentos” que el resto de CA juntos. No lo dudo, es muy posible, pero por una razón sencilla… con los otros CA tienes que rascarte el bolsillo, 50-100€, pero te los emitirían igualmente por mucho que digan algunos que no permitirían certificados en dichos dominios, a fin de cuentas si el dominio está registrado correctamente, la emisión de un certificado estándar (de tipo DV, validación de Dominio) solo requiere para cumplir con las estrictas normas de seguridad la validación del propio dominio, nada más.

Ante esto Let’s Encrypt ya ha dicho más de una vez lo mismo. Ellos no son la policía ni el organismo competente para censurar el uso que puedan o no dar otros a las web, eso será cuestión de otros, y que por suerte herramientas como Google SafeBrowser o Internet SmartScreen, están para eso. Repito, lo mismo sucede con cualquier otro CA. De echo, para curarse en salud, Let’s Encrypt tan solo emite certificados DV.

Muy diferente es el caso cuando se desea un certificado EV, esos certificados que añaden antes de la URL el nombre de la compañía. Esos certificados emitidos por un CA requieren una serie de verificaciones y burocracia muy superior, que precisamente buscan eso, que se pueda tener cierta confianza de que la web visitada corresponde al contenido que tienen. En el caso de la web de paypal fraudulenta puesta arriba, les sería imposible lograr que pusiese delante de la URL lo que realmente veríamos en una web de Paypal:


El contenido es exactamente el mismo, y al margen de que la URL sean diferentes, evidentemente, en esta vemos el “sello” del certificado EV “Paypal, Inc. US”. La anterior sería imposible que lo lograse, incuso lograr algo similar sería casi imposible, a caso iban a crear una empresa llamada Paypal Secure bla bla bla y lograr todo lo que se requiere?? No, no lo lograría. Pero eso no invalida el certificado DV, ni tampoco le quita la gran importancia/necesidad que estos certificados (DV) tienen. De echo, como explicaba en el artículo de Let’s Encrypt, los certificados EV son muy caros, y la mayoría de entidades no los usan por no ser necesarios, mucho más importante que mirar el sello EV es mirar la URL, que ojo… puede engañar también (otro día hablaré de ello), pero pensar que si tomásemos una empresa no conocida podría tener legítimamente su sello EV y ser igualmente fraudulenta por el contenido que tiene.

 

Hace unos días apareció la noticia de que Google castigaba duramente a los certificados EV de Symantec (uno de los grandes CA) por detectar durante años la emisión de EVs de estos sin las necesarias y más estrictas condiciones. Recordar que un CA es fiable sólo en la medida que los navegadores Web y otros software se fían de ellos y añaden en sus productos los certificados raíces de estos. Dicho de otro modo, en cualquier momento tanto Google, Mozilla, Microsoft… podrían bloquear/anular los certificados raíces del CA que quisieran, dejando los miles o millones de certificados emitidos por ellas totalmente inservibles. Es por eso que son aquellos que crean el software que nos conecta los que deciden que certificados añadir y que normas y condiciones tienen que cumplir para permitirles estar dentro de su software, y si no lo cumplen o detectan irregularidades, no tienen problemas en eliminarlos o castigarlos del modo que estimen. Y sí, han caído empresas grandes cuyo principal volumen de ingresos era la emisión de certificados porque los navegadores los bloquearon por emitir certificados fraudulentos.

Vale, pero he dicho que los certificados fraudulentos no son tales… en que quedamos. Bueno, he dicho que el ejemplo anterior no es un certificado fraudulento, pero claro que se pueden emitir certificados fraudulento. El ejemplo más sencillo, si mañana me pongo en contacto con un CA y les pido que me emitan un certificado para google.es, y me lo mandan, es un certificado fraudulento, y no porque ya exista uno legítimo, eso es indiferente, es fraudulento porque el dominio google.es no es mío, e incluso un certificado DV se debe de emitir sólo si se puede verificar la propiedad de dicho dominio. Peor aun si hablamos de certificados OV o EV.

En el caso de Google y Symantec, según se ha dicho en la nota de prensa, Google detectó irregularidades en la emisión de certificados tipo EVs, y ha optado por medidas bastante serias, y durante un año irá invalidando dependiendo de las fechas de emisión de estos, los certificados EVs de Symantec (si leí bien). Y esto no es poca cosa, eso causa un daño enorme a Symantec. Es en una de esas pocas cosas que vemos el tremendo poder que puede tener una empresa que desarrolla una navegador Web para con otras multinacionales de gran peso e importancia.. bueno, google es un gigante, pero pensemos en Google como desarrollador de Chrome. Por supuesto Symantec les ha respondido, que han exagerado los datos, que les parece un “castigo” desmedido, que en el peor de los casos que Google lo lleve a cabo re-emitirá certificados nuevos para todos los afectos para que no se vean afectos… etc etc etc.

 

Conclusión

Por supuesto la credibilidad y fiabilidad de un sitio es o debería de ser muy importante, el problema es que no existe un sistema para ello. La mejor forma de legitimar una web es conociéndola, mirando siempre muy bien las URL, usar tecnologías como Google SafeBrowser (usada en Firefox o Chrome) o Smart-Screen usada en Internet Explorer. Tener siempre la seguridad, sobre todo cuando vamos a introducir cualquier dato sensible que la web que tenemos delante ES la web que dice ser, y no fiarnos de si usa HTTPS para eso o no. HTTPS nos asegura un cifrado, no la identidad que pueda parecer decir ya sea por el contenido o por la URL. Eso no invalida para nada la necesidad de HTTPS, puesto que incluso aunque una web sea fraudulenta, puestos a escoger, dentro de los males el menos malo sería que usase HTTPS, al menos tendremos la seguridad de que los datos sólo nos lo roba quien hizo la web fraudulenta, y no además otro que nos espíe la conexión por no usar HTTPS.

Con la aparición de Let’s Encrytp la web ha dado un buen giro, y donde antes nadie usaría certificados, ahora el uso se está expandiendo enormemente, ya sea un blog personal (ya, lo sé, no se lo tengo puesto al blog, en casa del herrero cuchillo de palo), ya sean empresas, tiendas online… y eso es bueno, con independencia de que algunos los quieran usar para otros fines.

Pero no nos equivoquemos, la culpa no la tienen esos desalmados, ellos simplemente se aprovechan como siempre del desconocimiento de los usuarios, las empresas de CA se han empeñado durante años a decir que los certificados son necesario para la confianza, para la fiabilidad… y muchas campañas se han hecho acerca de esto, así que el usuario normal ha tomado por válido ciertas cuestiones, como que si la web tiene un certificado seguro, la página es segura = fiable = de_confianza.

HTTPS sí, siempre que sea posible y el certificado sea válido, pero por favor… no dejéis nunca de revisar bien y mucho ante la duda la web que los use.

Let’s Encrypt

Share on Google+Share on FacebookTweet about this on Twitter

le-logo-wide

Llevo ya un tiempo queriendo escribir algunas palabras sobre esto por dos motivos. El primero, debido a la gran importancia que a día de hoy debería de ser mantener las comunicaciones seguras entre los equipos de los usuarios y los servidores remotos, y en segundo lugar por lo que, desde mi opinión claro está, es la gran labor que han llevado a cabo y están realizando todos los que están detrás del proyecto de “Let’s Encrypt”.

Como es costumbre, vamos a hacer una pequeña introducción para explicar en primer lugar un poquito de todo esto para quienes no sepan de ello, y para los que sepan y aun estén recelosos clarar algunas dudas.

 

¿Que es Let’s Encrypt?

La versión corta y reducida es la que podemos encontrar en su propia web: https://letsencrypt.org/:

“Let’s Encrypt is a new Certificate Authority: It’s free, automated, and open” (Let’s Encyrpt es una nueva Autoridad de Certificación. es gratuito, automatizado y abierto).

Internet no se construyó en su origen para ser seguro, de tal modo que en su versión simplista se trataba de poder enviar información desde un punto a otro. Los años, y más los tiempos que corren, demostraron que eso está muy bien, pero se hacía necesario algún sistema de cifrado punto-a-punto que asegurase dicha comunicación. Los cifrados punto-a-punto se denominan así (ahora de moda con las aplicaciones de mensajería instantánea) porque el contenido se cifra/descifra en los extremos, es decir… se cifra en nuestros dispositivos y circula de ese modo hasta llegar al destino, haciendo que sea, en teoría siempre, poder “leer” dicho tráfico si alguien intercepta la comunicación en cualquier punto de dicha travesía. De este modo tan solo el origen y el destino de dicha comunicación podrían entender lo que están enviando/recibiendo. Esto fue vital para Internet, y así nació HTTPS, que todos estamos hartos de ver.

HTTPS se fundamenta en el uso de los protocolos TLS y SSL, los cuales a su vez su funcionamiento radica en el uso de lo que llamamos certificados digitales para poder crear un entorno de cifrado asimétrico (ya sea RSA, ECC…). Esto ya hablé bastante en su día, así que no voy a repetir el grueso de todo aquello, quien le interese, creo que estaba en el artículo de Seguridad: Encriptación y Autentificación (cap 4). Abreviando mucho, digamos que, al menos, el servidor al cual los usuarios se conectan para iniciar su comunicación de forma segura debe de poseer un certificado digital que será enviado al cliente al iniciar la conexión y que le dará a este toda la información necesaria para realizar esa conexión, como la clave pública que usará el cliente para cifrar la clave simétrica de sesión, los algoritmos a usar para el cifrado… e igualmente importante, los datos necesarios para que el usuario PUEDA VERIFICAR LA CORRECTA IDENTIDAD DEL SERVIDOR AL QUE SE CONECTA, empezando por el CA (Autoridad de Certificación) que emite dicho certificado.

El cifrado es esencial si queremos que nuestras comunicaciones no puedan ser leídas en ningún punto hasta su destino (evidentemente sobre todo cuando estamos transmitiendo información que pueda ser confidencial o importante como usuarios/contraseñas, tarjetas de créditos, datos personales..). Esto no es un problema para TLS/SSL, y a día de hoy si la implementación TLS/SSL es buena y usando las versiones más actuales y otros, el cifrado es, en la práctica, imposible de romper (no vamos a entrar en teoría de computación cuántica, errores de implementación, ataques de tiempo y otros). Pero el cifrado es solo la mitad del problema, porque nada podría impedir igualmente a quien quisiese interceptar la comunicación, suplantar el servidor destino haciendo de “hombre en medio” y mandar su propio certificado al usuario, creyendo este que es legítimo, y por otro lado este atacante se comunicaría hacia el servidor real, y como el es en ambos casos extremo de la comunicación, podría leer perfectamente toda la información cifrada tanto por uno como por otro. Incluso como muestra la siguiente imagen, se podría hacer uso de esto con fines igualmente legítimos: (Nota: La imagen está sacada de otro sitio, no tenía ganas de hacer una similar)

interceptionproxy

Este esquema muestra el problema que indicaba. Un cliente podría querer comunicarse con el servidor remoto www.example.com, pero un tercero que quisiese interceptar la comunicación (aka SSL Interception proxy) podría enviar su propio certificado (emitidio por Corporate CA) al cliente, recibir la comunicación por parte de este, y a su vez conectarse al servidor remoto real, que le enviaría su certificado real (emitido por Real Public CA) para reenviar lo que el cliente le mandase a él. Todo iría cifrado, desde el Cliente al intermediario, y del intermediario al servidor final. Problema?? Que realmente no sería un cifrado punto-a-punto, ya que en medio se habría colocado un tercero que podría estar leyendo absolutamente todo el tráfico que pasase por él.

¿Como se soluciona esto? Aquí es donde radica todo. La solución es que los clientes, cuando usan cualquier aplicación para conectarse a servidores remotos por conexiones seguras TLS/SSL (ya sea un navegador web, un gestor de correos, una aplicación de mensajería instantánea, un juego, un…) posee una “base de datos” propia que puede venir con el sistema operativo o con la propia aplicación, en la que se especifica claramente que Autoridades Certificadoras se aceptan como seguras. Realmente lo que contiene dicha base de datos son los certificados públicos de todos los CA válidos.

Así pues, si nuestro navegador web solo tuviese en su base de datos como CA a la FNMT (por poner un ejemplo), tan sólo los certificados emitidos por el certificado Raiz de la FNMT (o los secundarios que dependan de este si lo tienen permitido), serán validados y dados por bueno por el navegador del usuario, de lo contrario el navegador directamente nos pondrá en aviso, denegando por defecto la conexión. En el ejemplo anterior, el cliente quiere acceder al servidor www.example.com y lo que recibe es un certificado emitido por un tal “Corporate CA)” que dice ser el certificado de www.example.com. Si el cliente posee dicho CA en su base de datos como autoridad válida, no habrá problemas porque el cliente confía en que los certificados emitidos por dicho CA se pude confiar en ellos, y la comunicación se hará sin problemas. PERO!! Si la base de datos del cliente no tiene ninguna constancia del CA en cuestión, o el certificado que posee la base de datos del cliente del CA difiere al que el emite… la conexión muy probablemente no se realizará.

Eso significa que al final, además del cifrado hace falta la cuestión de confianza, que en última instancia viene dada por el CA que emite dicho certificado.

¿¿Que es Let’s Encrypt?? Un CA, ni más ni menos. Actualmente actúa como CA “intermedio”, no posee un certificado Raiz que sea “universalmente” aceptado, y depende de la generosidad en este caso de IdenTrust, que es el certificado Raiz, que a su vez emitió el Certificado CA de Let’s Encrypt que permite a estos emitir certificados. Por poner un ejemplo de si esta práctica es habitual o no, todos los certificados que usa Google usan esta misma política, Google no tiene certificado raiz propio, sino que su certificado CA intermedio está emitido/firmado a su vez por GeoTrust.

Pero hay cientos o miles de CA, ¿cual es su importancia?

 

El principal problema con los certificados digitales

Lo ideal es que el 100% de todas las comunicaciones fuesen cifradas punto a punto, en cambio el uso por servicios/webs es muy bajo en comparación al tráfico sin cifrar. ¿Por qué?

Bueno es simple. Cualquiera puede crear en cuestión de segundos un certificado digital para su empresa, para firmar código, para un servidor web… se tardan segundos, pero dicho certificado sólo será creíble de puertas para fuera si está emitido por un CA de confianza. Así que eso sólo deja dos opciones:

A) Convertirnos nosotros mismos en un CA de confianza y emitir los certificados que queramos.
B) Obtener el certificado que queremos usar de un CA de confianza

La opción A se antoja cuanto menos casi imposible. Llamamos un CA de confianza, básicamente a un CA que es universalmente reconocido por la gran mayoría de todos los desarrolladores, empresas y otros que hacen uso de certificados, evidentemente empezando por las empresas que están detrás de los navegadores Webs, de los Sistemas operativos… Es decir, que si cualquiera quisiera crear una empresa que se dedicase a actuar como CA, además de toda la infraestructura de emisión, revocación… tendría que ir solicitando prácticamente uno a uno la inclusión de su CA en el software/hardware del desarrollador/fabricante que fuese, y estos a su vez aplicarían y obligarían a cumplir con las normas más estrictas de privacidad y seguridad que estimen. Es un proceso muy largo (años perfectamente), y como digo no existe una base de datos oficial universal, sino que cada desarrollador/compañía mantiene aquellos CA que estima.

Como sencillo ejemplo, pongo por caso el problema que tenemos aquí en España con el DNI electrónico o los certificados CERES. Ni la FNMT que lleva muuuuchos años emitiendo certificados (y hablamos de una entidad totalmente seria, respetable y a nivel nacional) ha logrado ser incluido como un CA de confianza. Sólo hace unos días precisamente, han logrado por fin la inclusión en Mozilla, y después de al menos de 2 años de trabajo y ajustes de todo tipo en sus infraestructuras para tener la luz verde de Mozilla. Y eso tan solo se aplica a Mozilla (Firefox, Thunderbird…), porque si la FNMT quiere que Google o Microsoft incluyan su certificado, deben de solicitar su inclusión de forma similar a la que hicieron con Mozilla, y de nuevo someterse a todos los controles de estos. Como actualmente ese CA no está en nuestros navegadores, todos hemos sufrido aquí montones de veces lo que sucedía cuando accedíamos a páginas de las propias instituciones Españolas: Certificado no válido, error de comunicación… por qué?? Porque los certificados que usan son emitidos por CA que no están por así decirlo universalmente aceptos, así que es necesario instalar manualmente los certificados de dichos CA, especificando que dichos CA serán válidos para nosotros.

Actualmente, Let’s Encrypt tiene ya el visto bueno a su vez de la gran Mozilla, lo cual es un inmenso salto, y en conversaciones con Google/MS para sus respectivos navegadores/plataformas/software. Como he dicho actualmente actúa como CA intermedio, ahora busca independencia total, pero eso, aun teniendo ya luz verde por Mozilla, será un camino largo. Aun con todo, para tener en cuenta lo complicado que es esto, ni siquiera aquellos que incluyen tu CA como CA Raíz te dan un cheque en blanco, son necesarias auditorias externas cada X, especificar bien claro el uso que se le va a dar y que limitaciones, que tipo de certificados va a emitir… y aun con todo en cualquier momento, si de detecta cualquier fallo que los desarrolladores/compañías estimen, ni que decir tiene que la supresión del CA Raiz sería inmediata.

Pero es que la importancia es capital. Tener un certificado CA, ya sea Raiz reconocido (cosa muy muy compleja) o tener un CA intermedio firmado por un CA raíz, implica poder, en teoría claro está, emitir los certificados que se quisiesen para la tarea que se quisiese y para los dominios que se quisiese. Es decir… el sueño de cualquier Hacker, ya que con uno en su poder cualquier ataque de interceptación de tráfico por ejemplo, sería extremadamente efectivo y sencillo, y también simplificaría mucho los engaños y sitios fraudulentos. Así que es normal que las grandes no se tomen eso de admitir un CA Raíz así como así.

 

La opción B es la que a día de hoy hace uso el 99% de todos. En realidad tan solo las grandes instituciones, multinacionales o empresas que se dedican precisamente a la emisión de certificados, optan o pueden optar por la opción A, todos los demás lo que hacemos es obtener certificados emitidos por los CA de confianza, o en el caso de grandes empresas en todo caso lograr un CA intermedio (auditado y vigilado) por lo general para emitir sus propios certificados. En principio, cualquiera puede solicitar sin ningún tipo de problema un certificado a un CA para el uso que estime, ya sea un servidor Web, firmar código o lo que sea. Aquí nos vamos a centrar a servidores Web por ser además el uso mayoritario. La pregunta entonces se derivaría, una vez descartada la opción A, en cual es el motivo entonces, si virtualmente cualquiera puede solicitar un certificado a un CA de confianza: Dinero, el más viejo y conocido de todos, el señor billete, Cash, Money.

 

Tipos de Certificados (para Servidores Web)

A día de hoy existen básicamente 3 tipos de certificados para servidores Web, que se diferencia en función de la información que el cliente quiere por así decirlo validar ante el CA. Como al final todo es una cuestión de confianza, cuanta más información te valide el CA sobre tu persona/empresa, más fiabilidad dará dicha persona/empresa de cara a todo el mundo:

 

-Certificados de Validación de Dominio (DV):

Actualmente más del 60% de todos los certificados que podemos encontrar en la web corresponden a este tipo. El CA que lo emite sólo valida/garantiza que es emitido para el dominio en cuestión, sin aportar absolutamente ninguna otra información identificativa de dicho dominio. Es decir, por lo general basta ser tan solo el dueño o el administrador de un dominio para poder cumplir con los requerimientos que pueda exigir un CA en la emisión de un certificado de este tipo. Ojo!! Eso no significa que estos certificados sean malos, ni mucho menos, aunque se ha hecho muy mala prensa de ellos, pero por cuestiones principalmente de marketing indigno por parte precisamente de los propios CA para que los clientes adquieran certificados que veremos a continuación… que son mucho más caros.

Si visitamos una web, cualesquiera, accedemos por HTTPS y el certificado está validado por un CA de confianza, aun siendo de tipo DV podemos tener la certeza de que el certificado es de quien dice ser. Si un atacante intentase replicar dicho certificado e intentase usar el dominio original, tendría que poder controlar y tener acceso a la configuración del propio dominio para poder lograr un certificado emitido por un CA de confianza, de lo contrario aunque su certificado dijese que es para la web en cuestión, dicho certificado sería rechazado por los navegadores, aplicaciones… del cliente. Esto es importante, porque precisamente hace relativamente poco se culpaba a este tipo de certificados a que se había logrado realizar un ataque a gran escala, pero de nuevo el artículo era sesgado y creado por un CA de prestigio para desprestigiar a otros, si un atacante logra hacerse con el control total de un dominio, da igual al CA de confianza que acuda para la emisión de un certificado DV, porque se lo darán sin problema.

Los certificados DV, a efectos visuales, estamos hartos de verlos en los navegadores web: Candadito Verde, sin más.

certificado DVPor supuesto, siempre suponiendo que son emitidos por un CA válido, de lo contrario tendríamos advertencias de seguridad, candadito rojo o cualquier otro identificativo.

Certificado Info DV

-Certificados de Validación de Organización (OV):

Son el segundo grupo de certificados más usados en la actualidad, y en realidad muy similares a los DV. El CA en este caso emite los certificados no solo validando por los medios oportunos el dominio, sino que además solicita información adicional de la organización/empresa que hay detrás de dicha solicitud, lo que hace necesaria la aportación como es lógico de documentación legal y otros, necesario para que el CA pueda verificar la autenticidad de dicha empresa/organización.

No obstante a efectos visuales para el usuario son prácticamente iguales a los DV, y sería necesario mirar el Certificado directamente para ver la diferencia, que radica en que este tipo de certificados incluye en su variable O (Organization) precisamente la compañia a la que pertenece. En las dos pantallas que puesto anteriormente, no se podría saber si el certificado que he puesto es un DV o un OV, ambos tendrían el mismo aspecto.

Un ejemplo sencillo de certificado OV es el de Google: https://google.es. Pero sería necesario acceder al certificado en cuestión para ver que efectivamente está verificada la organización:

Certificado OV

Si nos fiajos en la pantalla de la derecha, Google Inc. está incluido dentro de la variable O del certificado, aunque sólo es visible si accedemos al visionado directo del certificado. En este caso particular vemos si miramos un poco mas abajo información del propio emisor (CA) del certificado, y básicamente se repite porque Google a su vez es un CA universalmente reconocido, con lo que evidentemente emite sus propios certificados. Cabe indicar que Google no es en sí un CA raiz, OJO!! A su vez depende del certificado Raiz de GeoTrust, aunque Google puede emitir sus propios certificados. Pero la parte que nos atañe aquí es el primer bloque.

 

-Certificados de Validación Extendida (EV):

Son como es natural los más caros, e igualmente los que en teoría ofrecen el mayor grado de confianza para los usuarios. En este caso el CA deberá de verificar mucha más información relevante sobre la propia compañía, siendo el proceso de verificación mucho más lento y profundo. La finalidad es clara, que el usuario final tenga la plena y total seguridad de que la web a la que está accediendo es 100% confiable. Aun con todo al final siempre es todo muy relativo, porque en cuanto a seguridad se refiere podría dar la misma seguridad un certificado tipo DV y OV. Si los certificados EV se crearon exclusivamente por cuestiones de marketing y como excusa de embolsar más dinero para los CA, lo dejo en manos de los lectores. En lo personal, aunque por supuesto estoy totalmente de acuerdo a que la fiabilidad que pueda otorgar un certificado EV es como es natural mayor a un certificado DV, eso no implica que un certificado DV no me de confianza alguna.

Está claro que un hacker, aun logrando acceso y control al dominio le sería virtualmente imposible o cuasi imposible lograr que emitiesen para el otro certificado EV para un subdominio de dicho dominio o cualquier cosa similar, o intentar crear una web con nombre similar e intentar que la organización y otra información pusiese en el certificado que es otra que se quiere suplantar. Eso es evidente, cuantos más controles sometan los CA a los clientes para emitir el certificado, este será más  confiable, pero lo siento… no soy de esos que aconseja por ello que cualquier tienda tenga que tener por obligación un certificado EV, como si hacen la mayoría de todos los CA (teniendo en cuenta que el precio es mucho mucho mayor)

En este caso, los certificados EV no obstante si son tratados de un modo más… especial por los navegadores Webs. Son muchas menos web en los que los hemos visto, pero no son extraños a día de hoy encontrar algunas webs sobre todo que los usan (curiosamente, muchas de ellas son empresas que actúan también como CA). Uno de los ejemplos más “estrella” de ello, es la archiconocida PayPal, que desde luego pocos sitios han sufrido más intentos de phising y SCAN. Podemos saber perfectamente si es un certificado EV porque la propia barra del navegador web cambia para mostrar una barra adicional verde que incluye directamente la información de la propia compañía:

Certificado EV

Esa “barra verde” que hace acopio en este caso Firefox automáticamente nos dice que estamos ante un certificado EV, y ni siquiera hace falta acceder a la información del propio certificado para ver que directamente nos da la información en el propio Firefox sin ir mas profundamente, mostrando la compañía e incluso la dirección de esta.

Muchos se preguntarán que por qué Google u otros grandes como Facebook no usan este tipo de certificados. Bien, oficialmente no existe una respuesta ante esto por sus partes, pero desde mi punto de vista es obvio, y viene a colación de lo dicho anteriormente. Los certificados EV, pese a mostrar más información directamente en los navegadores y que los CA necesiten más datos para emitirlos, no aportan por sí mismos nada más, no dan más seguridad ni más nada, sino que son un reclamo al público para decir: “Ei, mira, uso un certificado EV, tienes que fiarte de mi”. O por ejemplo: “Ei, ves?? Soy el mas guay y el mejor porque uso el certificado EV”. Google tiene nombre propio y en mayúsculas, su propia marca es él mismo y no hay persona que tenga un PC que no conozca quienes son. Evidentemente para ellos no es cuestión de dinero.

Como dije antes y lo reitero, que cada cual saque sus propias conclusiones sobre la necesidad, o no, de que los sitios como tiendas de comercio electrónico y otros requieran un EV, o les sea más que suficiente con un OV. No tiene nada que ver con la seguridad/cifrado, es sobre todo una cuestión de marketing, tanto para los CA que los venden, como para aquellos que quieren parecer mejores por tenerlos. No estoy en contra de los certificados EV, son importantes en muchos casos, pero la gran mayoría están movidos o por el propio marketing que quieren hacer ellos mismos para con el público, o por desconocimiento de quien los adquieren. Como siempre… es mi opinión.

 

 Let’s Encrypt

Bueno, y ¿qué tiene que ver todo esto con Let’s Encrypt?. Básicamente, que Le’ts Encrypt ha sido la primera iniciativa real y usable de que prácticamente cualquiera que tenga un dominio/hosting mínimamente decente, poder adquirir un certificado válido emitido por un CA de confianza (en este caso Let’s Encrypt, aunque de momento actúa por encima de ellos el certificado Raiz de IdentTrust), sin siquiera invertir un solo euro, y de manera además totalmente transparente, es decir… toda infraestructura que usan es de código abierto y puede verificarse, cumpliendo con todos los requisitos de seguridad que puedan cumplir igualmente cualquier otro CA. Eso sí, OJO, Let’s Encrypt SOLO EMITE CERTIFICADOS DV.

Para poner todo esto un poco desde cierta perspectiva. Tomemos los precios por ejemplo de un CA conocido como pueda ser Godaddy (iba a coger Symantec pero los preciso son mucho mayores.). Evidentemente estos datos no son extrapolables a otros CA, cada uno tiene sus propios precios, tomo los de Godaddy por ser relativamente conocidos y porque sus tablas de precios son muy claras. Sus precios anuales (redondeados) para un solo dominio sin incluir subdominios son los siguientes:

-Certificado DV: 85€
-Certificado OV: 110€
-Certificado EV: 227€

A nadie se le escapa que si quisiésemos por ejemplo un certificado que cubriese también todos los subdominios la gracia se nos iría a 330€ en el caso de los DV (siempre tomando de ejemplo los precios de Godaddy. Sí, prácticamente todos los CA que “venden” certificados garantizan con un seguro el certificado, pero no dejan de ser precios importantes a desembolsar de manera anual. No estoy en contra para nada de este tipo de certificados, no estoy endemoniando a Godaddy, Symantec, Comodo… para nada, ojo, son empresas en su mayoría muy profesionales y con grandes servicios, solo quiero poner en perspectiva todo el asunto que nos trae.

¿Que sucede? Pues que evidentemente una empresa no tiene problema en gastarse en sus presupuestos uno dos o los certificados que necesite, sean DV o incluso si se quieren dar la fardada y la presuntuosidad EV. ¿Pero que pasa con las Pymes?? ¿Que pasa con bloggers, autónomos y básicamente el gran grueso de la población? Que costearse incluso un certificado DV puede ser costoso para el poco uso que creen poder darle, y eso acompañado al desconocimiento es lo que hace que a día de hoy má del 60% de todas las web no soporten HTTPS. Y el problema por supuesto se multiplica si lo que se requieren son certificados wildcard/multiples subdominios o múltiples dominios.

Let’s Encrypt por otro lado, como digo, ha hecho posible que prácticamente cualquiera tenga acceso a certificados DV, sin importar el número de subdominios que se requieran o el número de certificados a necesitar por poseer múltiples dominios. Se ha criticado que el proceso sea relativamente automático, pero no nos engañemos… todos los CA usan procedimientos igualmente automatizados para ello (certificados DV), pero de nuevo es normal, a fin de cuenta una organización sin ánimo de lucro alguno está ofreciéndote los certificados DV que quieras a tus dominios y subdominios.

Por supuesto, no es oro todo lo que reluce, y Let’s Encrypt (a partir de ahora LE) puede no ser la mejor opción para todos. Vamos a ver que puntos son o deberían de ser de gran interés para el usuario:

-LE sólo emite certificados DV
-LE sólo emite certificados de 3 meses de vigencia (es lo habitual por otro lado, pero eso obliga a automatizar el proceso de renovación/instalación)
-LE requiere que tengamos como es normal acceso y control sobre el dominio, y si queremos que sea sencillo acceso root en el hosting en cuestión, de lo contrario el proceso puede ser más complicado.
-Muchas compañías de Hosting NO PERMITEN este tipo de certificados por cuestiones obvias, ellos mismos los venden. Aunque cualquier servicio de hosting en el que tengamos acceso al propio servidor como Root no debería de ser problema. Por suerte, y dada la gran aceptación que ha tenido muchas empresas de hosting de siempre están viéndose obligadas a permitir de forma “sencilla” su uso y su automatización completa.
-LE requiere que se tenga por lo general un conocimiento mínimo de que estamos haciendo, de que es un certificado digital y de como usarlo.

 

No obstante tampoco es tan malo como lo pitan algunos:

-LE permite emitir usar tanto certificados RSA como ECC (certificados mas pequeños, y más seguros)
-LE instalado correctamente permite automatizar todo el proceso de forma sencilla, con lo que la renovación no es un problema
-LE Es totalmente gratuito
-LE actualmente usa actualmente un certificado Raiz que generosamente les emitió un certificado intermedio para poder hacer funcionar la cosa, actualmente YA TIENEN el certificado propio CA Raiz aceptado por Mozilla (un gran paso), con lo que a medio-largo plazo serán incluso un CA de confianza de todo derecho.
-La gran aceptación ha “obligado” a grandes como Godaddy, OVH, WordPress… permitir su uso o directamente o indirectamente. Otros por desgracia como 1and1 y algunos otros, de momento al menos, no tienen intención. Siempre como digo en alojamientos web “estándares”, ya que cualquier servicio de hospedaje “completo” tipo servidores virtuales o dedicados, deberían de poder usarlos sin problema alguno.

 

Instalación/Uso

Esto me temo que depende enormemente de donde y como se quiera realizar. En su versión más simplista, suponiendo un control completo del propio servidor. Lo más simples es el propio “cliente” que aconseja Le, llamado Certbot, que tienen instrucciones sencillas para su instalación prácticamente en cualquier distribución linux y servidor Web que se use. Teniendo en cuenta la gran variedad, es obvio que no voy a explicar como donde y cuando.

No obstante, y con la idea en mente que pueda ser usado en la mayor cantidad de sitios posibles, se han creado diferentes clientes muy dispares que aprovechan las diferentes opciones de verificación de dominios que obliga, como es natural, LE para la expedición de los certificados. Así por ejemplo, CertBot requiere que se posean permisos de administrador, mientras que las herramienta acme.sh (hay otras) que podemos encontrar AQUI permite su instalación y uso sin necesidad de Root, aunque pueda ser necesario como es natural instalar uno mismo los certificados donde correspondan

Así tenemos muchos hospedajes Web “baratos” en el mercado que no permite root en sus servidores pero si especificar los certificados TLS. Gracias a herramientas como Acme.sh se pueden ejecutar por SSH en los servidores, lograr que LE nos expida los certificados y posteriormente instalarlos en los paneles de control que nos permita el proveedor. Quizás no es en este caso 100% automatizado, pero si hace que sea viable su uso, que a fin de cuenta es lo que importa. A medida que más proveedores se usan, más sencillo será tanto para administradores como para los propios chicos de LE automatizar las expediciones e instalaciones, y no dudarlo, mejorar con creces la seguridad global dentro de Internet.

 

Conclusión

Al final la idea es la misma: Que aquellos administradores o pequeñas/grandes empresas donde no se han usado certificados para asegurar el tráfico por HTTP por motivos económicos o por infraestructuras, les sea rentable y lo más sencillo posible. Esto no quiere decir que los certificados de cualquier otro CA tengan menos valor, repito. LE no es para todos, y lo comprendo. Pero eso no quita que alabe la gran idea y el gran trabajo que están realizando, y que sirva igualmente de tirón de orejas al resto de CA que hasta ahora han podido imponer un poco los precios que han querido, a fin de cuenta quien se iba a meter en emitir certificados desde un CA reconocible de forma gratuita.

Recomiendo a cualquiera que tenga dominio/hospedaje propio al menos informarse un poco al respecto, merece la pena, y que se plantee realmente si es viable o no su uso en cada caso. En lo personal lo tengo claro… quitando casos concretos, todos los dominios y otros que pueda gestionar irán poco a poco usando certificados de LE, siempre que crea que es necesario claro, gran prueba es que este mismo blog no solo no va sobre HTTP plano sino que no tiene opción (actualmente). Forzar HTTPS en cualquier sitio que pueda enviar información confidencial de ida o vuelta es mandatorio, al menos desde mi punto de vista, y más aun cuando hay datos sensibles. Un DV suele ser más que suficiente para la gran mayoría de casos, así que no hay motivo para no tomar LE muy muy enserio como opción.

Y sí, aunque theliel.es aun no está “asegurado”, ya empecé hace unas semanas con la implementación de LE en todos los dominios que están bajo mi control, que no son pocos, aunque eso no quiera decir que fuerce las conexiones HTTPS por defecto en todo momento. A fin de cuenta los procesos es mejor hacerlos poco a poco…

Desde aquí, aunque posiblemente no me lean, sólo dar la enhorabuena al trabajo que están realizando, creo sinceramente que es de esas iniciativas que sí cambian las cosas.

Google I/O 2012 – En Directo

Share on Google+Share on FacebookTweet about this on Twitter

Google I/O 2012

Share on Google+Share on FacebookTweet about this on Twitter

Como todos los años por estas fechas, dentro de unas horas comenzará Google I/O 2012 en San Francisco, algo así como el evento del año en el mundo Google, similar al TechEd de Microsoft o al WWDC de Apple. La importancia de estos eventos es evidente, y más en el caso de Google que tiene una hegemonía (para bien o para mal) en la mayoría de todos los campos tecnológicos que a día de hoy dominan nuestro mundo (para bien y para mal de nuevo): Publicidad online con AdSense, buscador web con Google, servicios empresariales con Google Apps, servicios al usuario con Gmail/YouTube/Blogger/Etc, Redes Sociales con Google+, Dispositivos portátiles (Móviles/Tablets/Televisiones) con Android, Navegador Web con Chrome, Desarrollo Energético… y me dejo un largo ETC. Lejos quedan los tiempos en los que Google “tan solo” era un buscador Web.

Es por tanto que si Google organiza un evento anual para presentar novedades, organizar charlas y talleres…. se reúnan representantes de la mayoría de todos los fabricantes de Hardware, desarrolladores de software y Web de todos los ámbitos, y por supuesto prensa y muchos otros interesados en tecnología.

 

Este año parece más o menos claro por donde van a ir los tiros, aunque por supuesto aun queda mucho a la imaginación, y es posible siempre que aparezca alguna novedad totalmente inesperada. El problema con las novedades es que muchas veces son secretos a voces, que no dejan de ser totalmente importantes e interesantes, pero pierden el cariz de ser sorpresibas, sobre todo cuando se lleva semanas hablando de ellas y la posibilidad de su anuncio en el evento de mañana.

Sea como sea, parece más o menos claro por donde van a ir los tiros y cuales serán muy posiblemente algunas de las sorpresas que se anuncien mañana en el Keynote del Evento:

 

-Nexus 7:

Así se ha bautizado en los círculos la que sería si los rumores son ciertos la primera tablet con el sello de Google. Parece estar prácticamente confirmado que hablaríamos de una Tablet de bajo coste y altas prestaciones, eso sí de 7 pulgadas. Integraría procesador Tegra 3 (4 núcleos), pantalla HD Ready (1280×720), 1GB RAM, cámara de 5-8MP, capacidad de 8-16GB…. y los extras habituales como WIFI, OTG, USB, HDMI, GPS, BT, quizás NFC… y que vendría de la mano de la nueva versión de Android 4.1 (Jelly Bean). El precio se estima en los 150-200€, un precio más que interesante.

 

-Android 4.1 (aka Jelly Bean)

Parece evidente que si aparece el Nexus 7 y su anuncio para su comercialización en Julio, este aparezca con JB (Jelly Bean). Además, hace muy pocos días se filtró por un fallo (queriendo o sin querer) de Google unas imágenes que mostraban claramente que el Galaxy Nexus sería el primer TELEFONO en ver JB, lo cual podría implicar que a la par que apareciese el Nexus 7 apareciese la OTA y la imagen de fábrica de JB para Galaxy Nexus, al menos para la versión maguro (versión GSM, la estándar).

Las novedades en cambio que puedan llegar con JB son totalmente un misterio. Se estima que una mejora sustancial del rendimiento con respecto a Ice Cream Sandwitch (ICS), cambios sutiles en la interfaz, actualización del paquete de aplicaciónes de Google (Gmail, Gtalk, Framework, Maps…), la posible integración de Gtalk con Messenger de Google+… pero posiblemente uno de los rumores que más está sonando también es la posibilidad de que Google diese el pistoletazo a Mejel.

 

-Mejel

Después llamado simplemente “Asistente de Google”. Este Asistente sería una versión mejorada de la ya conocida búsqueda por voz de Google que nos permite desde buscar un contacto, llamarlo directamente simplemente con la voz, escuchar música o redactar un mensaje (todo ello solo con la voz). De este modo se incluirían también algunas de las funciones que actualmente cuenta SIRI (el asistente de Apple), como poder responder a preguntas más o menos concretas.

Personalmente no veo la gran importancia de estos asistentes ni su utilidad, pero bueno, cualquier mejoría siempre es buena. Sobre todo porque cualquier pregunta que pueda responder este tipo de asistentes estará totalmente sesgada a lo que sus creadores quieran. Cualquiera que tenga un iPhone 4s y haya usado SIRI sabrá de lo que hablo, en el que cualquier resultado que aparece es el que desea que aparezca Apple. Hace unas semanas era precisamente uno de los fundadores iniciales de SIRI (que después compró Apple) mostraba su descontento con esto, aclarando que cada día que pasa SIRI está más “politizado” y que los resultados que ofrece son totalmente “manipulados”. No digo que Google metiese la mano hasta ese punto, pero habria que ser muy ingenuo para creer que no iba a añadir alguna variable o resultado o respuesta que le pudiese agradar a ellos.

Por otro lado, sinceramente esto de los asistentes virtuales me parecen un poco antisociales. Ya nos lo mostró el episodio de Big Bam Theory, en el que Rajesh prácticamente se enamora de SIRI como persona virtual. Sinceramente, si quiero charlar con alguien lo hago con mi pareja/mujer/amigos/familia, es mucho más gratificante, y sus opiniones son más inteligentes. Y si lo que quiero es saber el tiempo, una operación matemática o cualquier otra cosa, tengo Google o igualmente a alguien cercano para preguntarle, sin tener que hablarle a un aparato para que me conteste. Por tanto, salga a la luz Mejel o no, aunque cualquier mejoras es buena, lo veo simplemente una solemne gilipollez su uso como asistente personal, y a quien lo use le diría sinceramente: “Tío, date una vuelta, sal un poco más y charla mejor con los que tienes cercas que no con un aparato”

 

-Google Chrome

Parece también más o menos evidente que si JB ve la luz, el navegador que traiga incorporado sea ahora Chrome, dado que ya disponemos de este en fase beta en el Store de Google. Como muchos saben son más de Firefox (el cual tengo instalado por supuesto en Android), pero sin duda alguna Chrome es mejor navegador al que actualmente tenemos por defecto en nuestros terminales.

También es de esperar que Google presente alguna novedad respecto a Chrome dentro de los equipos de escritorio, una mayor compatibilidad HTML5, una orientación cada vez más claras a juegos y aplicaciones Web, aceleración hardware completa al estilo de IE o Firefox…

 

-Glass

No puede decirse que sea ya un proyecto secreto, ya vimos no hace demasiado al mismo Sergey Brin (Padre de Google junto a Larry Page) con las gafas puestas. Y es que literalmente hablamos de unas gafas. Para quien no sepa de que hablamos:

 Evidentemente es un proyecto en desarrollo, pero no podemos saber en que estado de este se encuentra, y es por ello que muchos creen que mañana se harán anuncios al respecto. Sea como sea puede ser una apuesta segura para el futuro, y es que ya son algunos fabricantes los que están comenzando a desarrollar sus propias gafas. La utilidad es como todo… habrá que esperar y ver (nunca mejor dicho)

 

-Servicios en Nube

Se espera que Google haga una serie de anuncios interesante dentro de la computación en nube, sobre todo orientado a las empresas. No parece estar muy claro por donde podrían ir los tiros, pero con la inclusión hace poco de Google Drive parece evidente que se están cociendo muchas novedades en este aspecto. Recordemos que Google ya cuenta con servicios puramente en Nube como Google Drive y su integración con Docs, Google Music e incluso Gmail, el cual podría integrarse completamente con otros servicios para compartir de forma simple incluso adjuntos de correos electrónicos.

Para las grandes empresas esto tiene una importancia mucho mayor, hablamos de aplicaciones en nube que puedan ejecutarse en cualquier dispositivo desde cualquier ubicación, acceso cómodo a datos, mayor número de aplicaciones para sincronizar (además de calendarios, agendas, correo, música, aplicaciones…). Y por descontado que todo ello repercutirá de forma directa en el usuario final, en forma de versiones lite de sus productos o ampliando los servicios que ya disponemos, desde mayor almacenaje en Music, en Drive, en Gmail… a saber.

 

Quitando las posibles novedades o rumores, lo que es cierto es que las charlas y talleres que se van a realizar están todos ya publicados, entre los que tenemos conferencias sobre Chrome, Android (como monetizar las aplicaciones Android, como mejorar la seguridad…), protocolos nuevos, programacion Web, HTML5, nuevas API para Google MAPs… una buena cantidad de charlas sinceramente interesantes, al menos para quien se mueva en el mundillo por supuesto, y sobre todo para fabricantes de software/hardware, diseñadores web o de aplicaciones móviles… todo ello está reflejado ya en la web oficial de Google I/O 2012, con lo que repetirlo aquí sería repetitivo.

Para terminar, recordar que también está disponible la aplicación en Play Store para seguir los eventos, así como la conexión en directo de todos los eventos que pondré mañana.

Un saludo.

La fiabilidad de las encuestas, votaciones… realizadas en la red, y lo fácil que puede resultar manipularlas

Share on Google+Share on FacebookTweet about this on Twitter

 

 

Inicio Fin (10 minutos después)
Opción 1º: 43.6%  20.7%
Opción 2º: 10.1%  4.8%
Opción 3º: 17.4%  8.2%
Opción 4º: 17.5%  8.3%
Opción 5º: 11.4%  58.1%
Número de Votos: 2506  5462

 

Raro es el día que nada más abrir Thunderbird no recibo en las suscripciones RSS algún resultado nuevo de alguna encuesta, votación o gráfica basada en las supuestas respuestas de los cientos y miles de usuarios que supuestamente votan en ellas para dejar su opinión: Cuestiones políticas, preferencias de consumo, concursos, sondeos… raro es el periódico o site más o menos conocido que no tiene una encuesta o recoge datos semanalmente, para luego exhibirlos igualmente en los periódicos, o en publicaciones de toda índole.

La pregunta que uno debería de hacerse es simple: ¿Como de fiables son estos datos? Y la respuesta es aun más simple: No lo son, y eso es lo gracioso. Esto no quiere decir que cualquier gráfica, resultado de encuentras o votaciones sea mentira o los datos no seas ciertos, significa que a día de hoy tomar por cierto esos datos simplemente porque cualquiera los exponga sería poco inteligente.

En este caso me he cebado/centrado en particular con un servicio de encuestas llamado tusencuestas.com que usan no pocas webs, que usan simplemente para plasmar unos resultados, confeccionar estadísticas y otros. Al igual que este sistema, existen muchos similares, algunos más seguros, otros menos. Esto no quiere decir que TODOS los sistemas sean susceptibles de manipular, aunque tampoco quiere decir lo contrario. Primero un poco de literatura y después veamos el caso práctico… quien quiera saltarse el bla bla bla puede irse más abajo directamente y ver lo que sucedió con tusencuestas.com

 

Lo peor de todo, además, es que detrás de esos datos muchas veces se puede encontrar no solo una duda sobre su fiabilidad, sino que son múltiples las cuestiones que nos pueden llegar a pensar que eso datos dictan mucho de ser ciertos. Hay que tener cuidado cuando se habla de manipulación de datos, dado que muchas veces no son manipulados directamente, pero hay muchas formas de manipular la información. Veamos algunos ejemplos:

 -“Lugar” en que se recogen los datos: Esto es simple, si por ejemplo aparece una encuesta o una gráfica aparece en un diario con fuertes tendencias políticas, los datos recogidos serán en su inmensa mayoría provenientes de lectores con la misma ideología política, y por tanto los resultados serían evidentes. Si la misma encuesta o los mismos datos fuesen recogidos en otro diario con fuerte tendencia política contraria, los resultados serían totalmente opuestos. Este sistema se usa de forma extensiva todos los días.  Personalmente, creo que cualquier encuesta o recogida de datos realizada por cualquier medio partidista o a fin a cualquier tipo ideología (religiosa, política, clase social…) carece totalmente de valor por lo mismo. Extrapolado a la tecnología sucede exactamente lo mismo, si entras en un foro a fin a Microsoft y pusieses una encuesta sobre lo bueno o malo que es Windows saldría que es bueno por una amplia mayoría, si lo haces en un site fin a Apple dirá que MAC OS.

-Confianza en el autor de dichos datos: Más simple aun, damos por echo que dicha recogida de datos tiene detrás a una persona de la cual hay que fiarse, que no haya modificado los datos ni vaya a hacerlo. Por supuesto no digo que lo haga, digo que podría hacerlo.

-Manipulación por parte de los propios usuarios: Incluso cuando se pongan las mejores intenciones en la fiabilidad de dichos datos, si no se usa un sistema decente para la recogida de dichos datos estos de nuevo no pueden tener ningún tipo de validez, y esto es culpa tanto de los propios usuarios como quien está detrás de todo ello.

 

Aquí no podemos señalar con el dedo o asegurar sin pruebas quienes inventan resultados o los manipulan, pero sí podemos ver lo simple que puede resultar para un usuario la modificación de estos, y si cualquier usuario muchas veces puede hacerlo, prueba irrefutable de la validez cero de este tipo de sistemas, sobretodo repito cuando no se es nada riguroso.

El principal problema, quitando por supuesto la honradez del equipo/persona que esté detrás de esa recogida de datos, son los sistemas usados para tales recogidas de datos. Muchas veces los propios equipos/personas encargadas en esa recogida de datos usan métodos consabidamente “manipulables” a fin de que los resultados sean aun más impactantes cuando son mostrados. Y es gracioso, puesto que lo único que debe de hacer un buen sistema de recogida de datos de este tipo es: Un solo submit/voto/estadística/comentario… por persona física. Y señores, uno es uno, no son dos ni tres, es uno ¿Es que acaso en las elecciones generales nos permiten votar más de una vez?

El mundo de la informática está sujeto de la picaresca humana, y seamos franco, en España tenemos mucha de esa. Y es que he llegado a encontrar encuestas incluso en periódicos (en sus ediciones digitales evidentemente) de primera línea en las que con tan solo seleccionar la opción indicada y darle a enviar se contabilizaba automáticamente un voto, sin importar cuantas veces lo hicieses. Es decir, un solo usuario podría en 3 minutos realizar cuantas… 100 votaciones? 300? Y eso sucede (al menos ha sucedido) como digo en medios principales de nuestro país, que días más tarde salen en portadas, noticiarios, radio… jactándose unos y otros de los resultados tan dispares que aparecen.

Existen muy variados sistemas para impedir este comportamiento por parte del usuario (impedir hacer trampas):

-Uso del DNI-e: Sería un sistema viable, seguro y riguroso, casi totalmente imposible de manipular. El problema es que el usuario tendría que molestarse más de lo debido para enviar la información (tener el DNI-e, un lector…)

-Introducción del DNI: Podríamos sortearlo introduciendo un DNI falso, en el mejor de los casos el site verifica el número frente a la letra, y para ello tan solo tendríamos que introducir cualquier número de 8 cifras y calcular la letra de este. Este sistema no sirve.

-El uso de Cookies: La mayoría sabemos que es una Cookie en el navegador, una práctica muy habitual es marcar el equipo del usuario con una cookie que registra la introducción de los datos e impide volver a repetirlo… el problema es que una cookie se puede borrar en lo que se tarda contar 3 misisipis. Este sistema es inútil.

-El registro de la IP: Muchos otros usan la premisa que si tenemos asignada una IP por nuestro ISP, si se registra esta IP se lograría un solo “voto por persona”. El problema es que detrás de un dispositivo NAT (un router por ejemplo) puede existir desde una familia ha una empresa con muchos empleados, y este sistema estaría denegando el acceso a dichos usuarios desde ese lugar, sin contar por supuesto que sería posible saltarse el sistema poxeando o tuneleando la conexión sin mayores problemas. Incluso es relativamente simple el uso de programas o scripts para automatizar el proceso para ir saltando de proxy en proxy constantemente. Este sistema es inútil.

-El registro del User-Agent: Todos los navegadores tienen por así decirlo un identificador propio y único en teoría que los identifica. Muchos sitios usan la combinación entre User-Agent+IP+Coockie para de este modo permitir tan solo “un voto por persona”, permitiendo solo desde la misma IP múltiples accesos siempre que fuesen con diferentes User-Agent, de este modo en teoría se estaría permitiendo a otro usuario diferente detrás de la misma IP pública poder realizar su aportación. El problema es que si cambiar la IP momentaneamente es fácil, modificar el User Agent es aun más simple. En Firefox es tan simple como cambiar la opción: “general.useragent.override”, o por supuesto por medio de scripts y wget en linux.Evidentemente este sistema es inútil.

 

Dado que el único sistema viable y seguro es molestar al usuario, esto no es viable, por tanto es lógico usar un sistema alternativo, que aunque sea posible de saltarse al menos sea lo suficientemente “lento” o farragoso para un usuario mal intencionado de sortear. Y ante esto hay dos aproximaciones que he visto de forma extensa: Los que usan JavaScript para realizar las comprobaciones pertinentes y lanzar o no así las peticiones, y los que usan PHP para lo mismo. JavaScript es un lenguaje que se ejecuta en los equipos de los usuarios, PHP se ejecuta en los servidores… por tanto cualquier programador que use JavaScript para este tipo de cuestiones, y sin ánimo de ofender a nadie, es idiota. Si se ejecuta en el equipo del cliente, el cliente puede modificar el código como quiera, y por tanto puede evitar prácticamente cualquier medida preventiva que hubiese añadido, por no decir que tendría acceso al código JavaScript y ver por donde pillarlo. Con PHP por otro lado no es posible saber que se está realizando en el otro lado, ese código no nos llega, tan solo podemos saber que datos enviamos nosotros, pero no como se tratarán esos datos.

En este caso concreto de tusencuestas.com, ni que decir queda que usan JavaScript para sus sistemas, algo realmente absurdo por lo simple que resultará como veremos modificar cualquier votación/encuesta que usa su plataforma en unos pocos minutos.

Tomemos de ejemplo una web cualquiera que use este servicio, en este caso concreto he tomado la web de un programa televisivo bastante conocido en España, y que por deferencia a ellos me abstengo de decir. En este portal aparecen encuestan semanales cuyos resultados son al final presentados en el propio programa de televisión. La votación semanal en esta ocasión cuenta con 5 opciones posible, que por motivos obvios no pongo que se vota ni cuales son las opciones… de lo contrario cualquiera podría saber a que estábamos refiriendo. Actualmente la distribución es la siguiente:

1º Opción: 43.6%
2º Opción: 10.1%
3º Opción: 17.4%
4º Opción: 17.5%
5º Opción: 11.4%

Con un total de 2506 votos.

El problema reside como he dicho en que este proveedor de encuestas/votaciones, tusencuestas.com, usa JavaScript para registrar las votaciones, y para peor males tan solo prohíbe la votación por una simple verificación de Cookie. Aun así, como veremos más adelante, el echo de usar una cookie o no para verificar si el usuario ya votó o no es totalmente irrelevante. 

Lo primero es echar un vistazo al código HTML del formulario de envío de la votación:.

<div id=”tusencuestas_identificador”><div width=”100%”><div width=”100%”>Nombre de la Encuesta</div><div width=”100%”>
<input type=”radio” value=”287603″ name=”tusencuestas_respuesta_resultados_name”> Opcion 1º<br>
<input type=”radio” value=”287604″ name=”tusencuestas_respuesta_resultados_name”> Opcion 2º<br>
<input type=”radio” value=”287605″ name=”tusencuestas_respuesta_resultados_name”> Opcion 3º<br>
<input type=”radio” value=”287606″ name=”tusencuestas_respuesta_resultados_name”> Opcion 4º<br>
<input type=”radio” value=”287607″ name=”tusencuestas_respuesta_resultados_name”> Opcion 5º<br>
</div><div width=”100%”><span align=”center”>
<input type=”button” onclick=”tusencuestas_votar();” value=”Votar”></span><br>
</div></div></div>

 Por comodidad he eliminado algunos hash que continuaban a cada propiedad name. El caso es que se trata de un formulario muy simple, 5 opciones posibles a las que se asigna dependiendo de cual esté seleccionada un valor diferente. Cando el usuario quiere enviar su voto tan solo tiene que presionar el botón “Votar” que aparece en la encuesta, en cuyo caso el formulario invoca la función “tusencuestas_votar()”.

Del mismo modo, podemos echar un ojo al código JS de la web dicha función:

function tusencuestas_votar()

{
if (cookieHabilitada())
{
var accion_argumento = tusencuestas_recogeValor();
tusencuestas_accion(2, accion_argumento);
if (accion_argumento != “-1”)
{
var expira = new Date();
expira.setSeconds(expira.getSeconds() + 604800);
setCookie(“P_Id” + P_Id_hash, “1”, expira, “/”);
}
else
alert(‘��Escoge  una opcion!!’);
}
else
alert(‘No puedes votar porque no tienes las cookies habilitadas’);
}
 En realidad antes de pasar a esta función, si nuestro navegador envía una Cookie anteriormente seteada, el sistema no nos permitirá realizar la votación, y en vez de eso nos mostrará el resultado que pusimos anteriormente. La función mostrada tan solo tendremos acceso a ella si nuestro navegador no posee aun la cookie en cuestión. La función es bien simple. Si tenemos las cookies habilitadas, recoge el valor de nuestra opción marcada y lo almacena en la variable accion_argumento, y después invoca otra función que supuestamente será la que registre la votación. El resto de la función simplemente setea la cookie para que el sistema detecte al visitante que ya ha votado o muestre uan advertencia si tenemos las cookies deshabilitadas.
 
En otras circunstancias más complejas tendríamos que continuar con un seguimiento de las funciones que se van llamando, así como verificar efectivamente que la funcion recogeValor efectivamente captura el valor de la opción marcada (mostrado anteriormente en el código HTML). Pero lo cierto es que los amigos de tusencuestas.com lo han dejado francamente sencillo. Simplemente usando la consola del navegador (Ctr+Shift+k en Firefox) podemos introducir insitu el código JS que deseemos inyectar en la web que queramos, a fin de cuenta como hemos dicho el código JS es ejecutado en nuestro equipo. Así pues, podemos de forma directa introducir la función que suponemos es relevante para el caso:
 
tusencuestas_accion(2, 287607);
 
El valor 287607 no es arbitrario evidentemente, corresponde a la opción 5º del código HTML anteriormente tomado. Es decir, si todo es correcto simplemente invocando esa función en dicha web, se estaría enviado un voto a la 5º opción, sin preocuparse nadie ni nada de cookies o historias. siempre quedaría la opción de que el servidor denegar multiples conexiones desde la misma IP, pero este no es el caso.
 
Interesantemente, el servidor al introducir esa función por consola nos responde con:
 
GET http://www.tusencuestas.com/acciones/tusencuestas.aspx?44905… [HTTP/1.1 200 OK 1231ms]
Está acortado por comodidad, es a fin de cuenta una URL compuesta entre otras cosas con el ID de la encuesta (que he suprimido desde el comienzo, el valor de la opción y algunos datos más.
 
Llegados a este punto, cada vez que introducimos la función por la consola y le damos a enter, automáticamente si lo comprobamos el sistema registra un voto!! Simplemente presionando cursor arriba y enter introducimos en el sistema un nuevo voto… 10, 100, 1000… pero seamos sinceros, eso un poco farragoso y un trabajo manual de narices si deseamos por ejemplo darle la vuelta a la encuesta, o suponer en una encuesta que hayan miles o decenas de miles de votos… nos llevaría un ratito. Por suerte el voto se registra simplemente con una petición GET al servidor, como vemos en la propia consola. De echo si copiamos la URL y la pegamos directamente en la barra de dirección se registra también el voto. Por tanto, nada más sencillo que automatizar el proceso:
#!/bin/sh
X=0
while [ $X=0 ]
do
wget -O- –timeout=1 “http://www.tusencuestas.com/acciones/tusencuestas.aspx?44905…”
done
exit 0
Un simple script que realiza de forma indefinida peticiones HTTP que registrarán el voto por medio de wget, especificando que no se desea un arcivo de salida y un timeout de 1 segundo (ahora mismo lo necesito por cuestiones de retrasos de la línea en la que estoy). Y con eso el negocio quedaría terminado.
 
Para ver si funciona tan solo hay que invocar el script y ver que pasa al cabo de un ratito, pongamos 10 minutos:
 
 1º Opción: 20.7%
2º Opción: 4.8%
3º Opción: 8.2%
4º Opción: 8.3%
5º Opción: 58.1%

Con un total de 5462 votos.

 
En realidad, poca importancia tendría que tener esto, a fin de cuenta que importancia puede tener si en un periódico hacen una encuesta sobre cual es político mejor valorado o el peor… No porque la encuesta o la votación en sí carezca de sentido, sino que se usan la mayoría de las veces con fines demagogos. La importancia radica de nuevo, como en la mayoría de las veces, en lo que el usuario cree o quiere creer, dejándose casi siempre influenciar por lo que leen/escriben otros, sin pensar generalmente un poco por ellos mismos. ¿Cuantas gráficas vemos con datos tan contradictorios a lo largo de la semana? Si accedes a cierto tipo de sitios las estadísticas son unas, si entras en otros las estadísticas son diferentes… a veces explican con pelos y señales las condiciones en las que los datos fueron recogidos, otras veces son tan absurdas que comparan manzanas con platanos tan solo para que los defensores salten a la red en cualquier lugar: Blog, foros… defendiendo a ultranza a veces con total fanatismo ideas de otros con datos tergiversados y muchas veces manipulados.
 
Ahí queda eso señores. Solo espero que aquel que lea estas letras, la próxima vez que vea una encuesta, votación, gráfica… se pregunte aunque solo sea por un segundo de donde salieron esos datos, que sistemas usaron y que intereses o no puede existir detrás.
 
Un saludo.
Volver a arriba

Sobre Mí

Cambiar a la versión para móviles

Creative Commons License
Alma Oscura por Theliel is licensed under a Creative Commons Reconocimiento-No comercial-Sin obras derivadas 3.0 Unported License.
Basado en el trabajo de blog.theliel.es.
Para otros permisos que puedan exceder el ámbito de esta licencia, contactar en blog.theliel.es/about/contactar.