Viccionari:Criteris d'inclusió
Com a diccionari universal, aquest projecte té l'objectiu d'incloure tots els mots i termes de totes les llengües explicats en català. Aquesta pàgina defineix què s’entén per tots els mots i termes i quins són els criteris d’inclusió. Bàsicament: «que tingui interès lexicogràfic i que es pugui atestar el seu ús real».
Principi general
modificaUna entrada es pot incloure si té sentit des d'un punt de vista lingüístic, si és probable que algú la cerqui per saber què significa. Formalment, una entrada ha de correspondre a un terme que es pugui atestar que té un ús real en una llengua.
Entrades
modificaLes entrades en aquest diccionari no estan limitades a simples mots. També es poden incloure:
- Prefixos i sufixos.
- Abreviacions com símbols, abreviatures, sigles, acrònims.
- Modismes, locucions i frases fetes.
- Caràcters lingüístics.
Els criteris d'inclusió serveixen tant per les entrades que en poden crear com per accepcions específiques en una entrada existent.
Atestació
modificaL'atestació d'una entrada significa verificar
- que és d'ús corrent en la llengua corresponent, o bé
- que es pot trobar escrit o enregistrat, de forma que transmeti el significat, en diferents mitjans independents i estable en el temps.
Sempre que sigui possible, és millor afegir citacions en l'entrada per esvair dubtes i de forma que es pugui verificar fàcilment. El nombre de citacions necessàries pot ser variable segons el cas. Vegeu a continuació una explicació més detallada dels conceptes d'atestació.
Fonts
modificaLes fonts haurien de ser accessibles de forma permanent, s'haurien de poder consultar igualment d'aquí a uns anys. Com que aquest és un diccionari en línia es poden prioritzar fonts accessibles en línia i arxivades de forma durable. Els mitjans impresos, com llibres o periòdics, també són vàlids, especialment si el seu contingut està indexat en línia, per exemple amb l'ISBN. No són admissibles les citacions de projectes germans com la Viquipèdia, però poden ser útils les citacions de llibres disponibles a Wikisource.
Transmetre el significat
modificaPer atestar l'ús, cal que la citació usi el terme amb el seu propi sentit, que transmeti el seu significat en el context. Si a més inclou una definició, està bé, però no és la part essencial.
En canvi, una simple menció és per exemple la inclusió en una llista de mots, comentaris formals (com “té tres lletres”), definicions aïllades i exemples sobre com es pot usar el terme. A notar que això inclou els diccionaris. Un diccionari no és cap atestació de l'ús d'un terme, ara bé la inclusió en un diccionari normatiu o de referència pot ser indicador del fet que és, o havia estat, d'ús corrent i que l'atestació és innecessària. Per altra banda, també es poden trobar hàpaxs o errors en els diccionaris. Per certes llengües pot ser suficient una menció en una obra de referència (vegeu a continuació).
Nombre de citacions
modificaEs poden distingir diferents casos: llengües suficientment grans amb recursos ben documentats a internet, altres llengües menors i llengües mortes. Com a orientació, dins de les llengües romàniques es considera el català com a llengua ben documentada i es considera que l'occità no té un corpus suficient en línia. Els localismes en català es podrien considerar en el grup de no prou documentats.
Per les llengües ben documentades cal un mínim de tres citacions per atestar el seu ús. Per altres llengües vives menors serà suficient una sola citació, o bé una menció en alguna de les fonts de referència per aquella llengua. Per les llengües mortes pot ser suficient una simple menció en alguna de les fonts de referència per aquella llengua. Allò que es considera una obra de referència per una llengua determinada, i que és suficient per usar com a menció, queda a criteri dels editors d'aquella llengua.
Fonts independents
modificaEl criteri d'usar fonts independents serveix per prevenir atestacions que no són realment diferents. En general, dues citacions són independents si són diferents oracions fetes per gent diferent. No són independents si són còpies o traduccions quasi verbatim de la mateixa font original o bé són del mateix autor.
Estable en el temps
modificaNo es consideren termes que tenen un ús puntual en el temps i que després no es tornen a usar. L'atestació amb tres citacions haurien de tenir un any de diferència entre elles per assegurar l'estabilitat del seu ús. Aquest és un límit arbitrari però que funciona en la pràctica.
Modismes
modificaUna locució o expressió és idiomàtica si el seu significat no es pot deduir fàcilment a partir dels seus components. Per exemple, un ou dur és diferent del sentit literal dels seus components. És un ou cuit de determinada forma i diferent d'un ou passat per aigua. En canvi, estar cansat no és cap modisme. Vegeu Viccionari:Compostos.
Algunes expressions bàsiques poden ser útils per aprenents d'una llengua. Per exemple, com et dius? és deduïble a partir dels seus components, no és cap modisme, però la seva construcció formal pot no ser evident i ser diferent en altres llengües. A hores d'hora no hi ha cap consens establert sobre les entrades de fraseologia bàsica.
Els numerals (com trenta-tres o trenta-tresè) es poden atestar fàcilment però no són modismes. En aquest cas es considera adequat mantenir els numerals entre zero i cent per facilitar el coneixement de la seva construcció en cada llengua, i de les variants.
Traduccions
modificaEls criteris d'inclusió s'apliquen a cada llengua. Si una llengua té un terme determinat que només es pot traduir en algunes altres llengües amb locucions o frases, això no implica que aquestes locucions es puguin incloure directament. Per exemple el castellà ahorita equival a la locució de seguida, però asuntillo no justifica crear petit afer.
En algunes llengües certs diminutius, augmentatius, comparatius o altres derivats poden ser d'ús comú sense correspondència directa en altres llengües.
Variants ortogràfiques
modificaEs poden incloure variants ortogràfiques que es puguin atestar suficientment, encara que no siguin correctes ni normatives. Això no inclou les errades puntuals en l'escriptura, però sí les variants locals o històriques.
Especialment en català prefabrià es poden trobar múltiples variacions ortogràfiques. Cal ser prudent per incloure només aquelles que puguin ser útils, que es puguin atestar de forma estable en el temps, i marcar-les clarament en el seu àmbit històric no normatiu.
Cal tenir en compte que en moltes llengües, com l'anglès, no existeix una acadèmia que estableixi una norma ortogràfica. Certs mots són propensos a vacil·lacions en l'escriptura, tot i que les gramàtiques i normes d'estil determinen quina és la forma preferent.
Formes
modificaS'inclouen les formes flexionades, declinades o conjugades (vegeu Viccionari:Presa de decisions/2008/Plurals, conjugacions i declinacions). Les entrades per a formes han d'enllaçar al corresponent lema i indicar de quina forma es tracta. Les entrades amb formes que siguin també modismes han d'indicar tant el significat literal predicible com el significat idiomàtic.
Repeticions
modificaEls mots atestats amb repetició de lletres o síl·labes per a èmfasi, per exemple hahaha com a repetició emfàtica de la interjecció ha, s'inclouen normalment amb tres repeticions. Les repeticions amb dues lletres o síl·labes, o amb més de tres, es poden redireccionar directament amb la funció #REDIRECT.
Llengües a incloure
modificaLlengües naturals
modificaTotes les llengües naturals, vives o mortes, són acceptables. Cada llengua hauria de tenir un codi ISO 639, excloent aquells codis que són per grups de llengües. Tanmateix, si una llengua proposada és realment una llengua o un dialecte d'una altra és una qüestió que pot ser polèmica i subjecte a consideracions polítiques. Intentem guiar-nos pels criteris lingüístics majoritàriament establerts i en tot cas caldria discutir-ho cas a cas.
Com a llengües naturals s'inclouen les llengües de signes.
Les llengües mortes han de disposar d'un corpus escrit. En cas contrari es pot tractar de llengües reconstruïdes com el llatí vulgar o el protoindoeuropeu. En principi no incloem llengües reconstruïdes però és un tema subjecte a discussió.
Llengües artificials
modificaLes llengües artificials, construïdes o planificades s'inclouen cas a cas. En principi tenim algunes entrades en esperanto, ido, interlingua i volapük. En canvi, s’ha descartat incloure entrades en toki pona.
Les llengües fictícies, originades en obres literàries o cinematogràfiques (p.ex. klingon), tenen un interès lingüístic limitat a l'obra corresponent i no es consideren adequades per incloure-les en el diccionari.
Noms propis
modificaNoms de persona
modificaEls prenoms, els cognoms i els hipocorístics estan subjectes al mateix criteri d'inclusió que els noms comuns. La majoria són fàcils d'atestar pel seu ús ampli referit a una persona determinada. Ara bé, alguns prenoms no tradicionals poden ser equivalents a un neologisme, o bé poden ser obres de ficció d'un sol autor.
No s'inclouen noms complets de persones ni cap contingut genealògic. Això és informació enciclopèdica i només interessa la seva part lingüística.
Noms de lloc
modificaS'inclouen els noms de lloc de la toponímia major:
- Continents i zones geogràfiques
- Oceans i mars.
- Estats i països.
- Entitats administratives de primer nivell.
- Ciutats i municipis.
- Barris i districtes de grans ciutats.
- Arxipèlags i illes
- Grans muntanyes, rius i llacs.
L'interès és lingüístic i no enciclopèdic. La definició ha de ser breu per situar el lloc i no excessivament descriptiva. Pot ser interessant saber la seva etimologia i com es pronuncia en cada llengua. El concepte de toponímia major i menor pot ser diferent en cada llengua per tenir referents geogràfics diferents. Per exemple en català poden ser d'interès tots els municipis de l'àmbit lingüístic català i en canvi els municipis de Polònia s'usen en polonès sense cap integració en català, tret de la capital. En el cas de municipis amb noms compostos pot ser d'interès lingüístic només el nucli del nom, per exemple Arenys per Arenys de Munt i Arenys de Mar.
Noms comercials
modificaEls noms comercials d’empreses o de productes que han estat lexicalitzats com a noms comuns es tracten segons el criteri general d’atestació. En altres casos usats com a noms propis haurien de tenir un cert grau de lexicalització més enllà del seu ús comercial. No estan determinats els criteris per atestar l’ús de noms propis comercials.