El CTILC fou dissenyat, com a part de l’activitat lexicogràfica de l’IEC, per a servir de font principal en l’elaboració del “Diccionari descriptiu de la llengua catalana”. Tal com ha estat constituït, però, aquest corpus pot servir de base també per a la realització d’estudis de la més diversa naturalesa basats en anàlisi de la llengua catalana escrita. En el seu conjunt, el CTILC té una extensió de més de 52 milions de mots analitzables. Els textos que conté pertanyen a un període d’uns 150 anys (de 1832 a 1988). Des del punt de vista de la naturalesa de la llengua tinguda en compte, el corpus inclou els més diversos tipus de text, tant de caràcter literari (narrativa, teatre, poesia, assaig), com de caràcter no literari (tractats i manuals sobre les diverses disciplines, articles en publicacions especialitzades i de divulgació, textos legals, premsa diària i publicacions periòdiques diverses, fullets, prospectes, etc.). El CTILC és un corpus completament anotat pel que fa a la categoria lèxica i morfològica dels mots que conté; cadascuna de les ocurrències del corpus (exceptuant-ne els noms propis i altres seqüències no analitzables) està associada al seu corresponent lema (entitat referencial que agrupa tota la sèrie flexiva i apreciativa d’un mot, així com les seves variants gràfiques) i està etiquetada amb la categoria morfològica que correspon a la seva forma (qualsevol de les formes flexionals, les formes apreciatives o les variants gràfiques que pot adoptar un mot). La consulta del CTILC es pot fer per un o més lemes i/o formes. Es poden definir també filtratges per a les consultes que permeten restringir els resultats per autor/obra o per cronologia i tipologia de les obres del CTILC. El CTILC recull les formes efectivament usades en les obres. Moltes d'aquestes formes no es corresponen amb les formes normatives de l'IEC. Si voleu assegurar-vos que un lema o una forma són normatius, heu de consultar el Diccionari de la llengua catalana. Accés al CTILC |