domingo, 18 de febrero de 2018

VOCABLOS




Quienes me conocen pueden dar fe de mi avidez lectora. Siempre que he podido he procurado tener un libro en las manos bien para simple disfrute bien por obligación en asuntos laborales o en las diferentes épocas de estudio a lo largo de mi vida. Si la memoria no me traiciona, el primer libro que recuerdo haber leído, hacia los diez años, es Ben-Hur, de Lewis Wallace, en aquella colección de Joyas Literarias Juveniles de Bruguera en la que el texto se entremezclaba con páginas gráficas. Blanco y negro todo, como correspondía a la época.

Tras la fotografía y el cine, lo digital acabó llegando al mundo de los libros, lo que permitió separar continentes de contenidos. Hace ya casi una decena de años que por indicaciones de mi buen amigo Miguel Ángel compré mi primer lector digital con lo que los continentes empezaron a quedar en el olvido a medida que disponía de contenidos con los que cargar mi e-reader. Los sufrimientos en muchas horas de lectura en el transporte público —trenes, autobuses o metros— camino del trabajo o regreso del mismo se vieron muy aliviados al no tener que cargar con verdaderos tochos —libro de muchas páginas en la acepción cuarta del diccionario de la lengua española—que muchas veces no sabía cómo sujetarlos o incluso se hacía difícil pasar la página, por ejemplo viajando de pie en un vagón de metro atestado de gente. También, gracias a la liviandad de los lectores digitales he vuelto a recuperar la lectura en la cama antes de dormir por la comodidad que supone el ni siquiera tenerlos que sujetar como ya contaba en la entrada «DEDO» de este blog.

Tras esta pequeña divagación, vayamos al grano. Un libro como el Quijote, en términos de papel y por tanto de su «continente», podremos encontrarlo en muy variados formatos, desde ediciones de lujo a ediciones bolsillo. En buena lógica y salvo aditamentos, el texto del Quijote debería ser el mismo tal y como le dejara Cervantes hace ya algo más de 400 años. Es decir, el número de vocablos o palabras contenidas en todas las ediciones debería ser la misma. Hasta la aparición de lo digital, la única posibilidad de saber si un libro era tocho o liviano era la vista y aún ni eso, porque era conveniente abrirlo y revisarlo por dentro para inspeccionar la composición de las páginas en cuanto a sus márgenes, tipo de letra y separación de líneas y párrafos. Es decir, solo por el formato o el número de páginas no podemos hacernos una idea del tamaño real de su contenido.

Lo digital ha venido en nuestro auxilio en este asunto y de una manera fulminante. Si conocemos el número de vocablos de un libro, de una determinada edición o revisión, su tamaño es el que es: tantos vocablos. Ya sé que tan vocablo es la preposición «a» como la palabra más larga registrada en el diccionario que al parecer es «electroencefalografista» con sus veintitrés letras. Como curiosidad yo hasta ahora creía que era «esternocleidomastoideo». No sería lo mismo, desde el punto de vista de la totalidad de los vocablos, leer un libro lleno de «aes» que de «electroencefalografistas», pero si nos atenemos a la estadística nos convenceremos de que el número de vocablos de un libro es un índice que tiene relación directa con su tamaño.

Con ello, la teoría que propongo es que el conocer el número de vocablos de un libro nos dará idea del grado de tochicidad al que nos enfrentaremos cuando acometamos su lectura. Voy a tratar de demostrarlo y para ello he seleccionado catorce libros que pueden verse en el siguiente cuadro con algunos datos adicionales que ahora comentaremos. El estudio completo de estos catorce libros estará disponible por un tiempo en este enlace. (NOTA: No hace falta crear una cuenta para su descarga, en la parte de abajo está disponible la posibilidad de hacerlo sin ella).

LIBRO
VOCABLOS
GENERALES
%
ARTÍCULOS
%
Asimov, Isaac-Fundación
67.363
33.104
49
7.825
24
Cervantes Saavedra, Miguel de-El ingenioso hidalgo don Quijote de la Mancha
381.307
173.344
45
34.514
20
Follett, Ken-Los pilares de la Tierra
423.157
208.105
49
51.287
25
Gómez-Jurado, Juan-La leyenda del ladrón
178.912
84.970
48
24.120
28
Montero, Rosa-La carne
52.314
24.813
47
6.039
24
Navarro Soriano, Esteban-La gárgola de Otín
73.178
34.047
47
8.759
26
Rodríguez de las Heras, Antonio-Metáforas de la sociedad digital
34.824
16.330
47
5.106
31
Romero, Ana-El rey ante el espejo
86.220
42.104
49
11.921
28
Ruescas, Javier-Play
123.772
56.548
46
12.200
22
Silva, Lorenzo-Donde los escorpiones
102.791
44.900
44
10.691
24
Steinbeck, John-Las uvas de la ira
182.908
90.382
49
23.105
26
Stendhal-Rojo y Negro
172.719
84.416
49
20.373
24
Tolstoi, Leon-Guerra Y Paz
575.788
282.264
49
68.860
24
Verne, Julio-Veinte mil leguas de viaje submarino
141.129
69.968
50
19.098
27

En la primera columna podemos ver el número de vocablos que tienen los libros seleccionados, en la versión digital de la que dispongo. En la segunda columna se muestra el contador de aquellos vocablos que he considerado «generales», es decir todos con la exclusión de artículos, preposiciones, verbos auxiliares, pronombres, adverbios, conjunciones, número y algunas palabras especiales. En la tercera columna aparece el porcentaje que suponen estos vocablos generales con respecto al total. Si nos fijamos con detenimiento, 11 de los 14 libros oscilan entre el 46 y el 49%, es decir, todo muy similar, aproximadamente la mitad de los vocablos tienen «sustancia».

Lo mismo ocurre con el resto de conceptos. He añadido los mismos contadores para los artículos, y nuevamente 11 de los 14 libros oscilan entre el 24 y 28% del total, de nuevo bastante similar.

Hay que tener en cuenta que los libros escogidos son antiguos o actuales, con muchos o pocos vocablos, traducidos o no, y todos presentan el mismo patrón. Es posible que haya otro tipo de libros técnicos, poesía, etc. que no cumplan estos patrones pero en lo que se refiera a narrativa son muy parecidos.

Sería interesante que las editoriales, además de consignar en su propaganda el número de páginas, hicieran mención al número de vocablos tanto si se trata de una edición en papel como si es digital. Entiendo que todas, hoy en día, disponen de una versión digital del texto del libro pues no me imagino a los autores enviando textos manuscritos o escritos a máquina de escribir para su publicación.