Contingut suprimit Contingut afegit
Línia 113:
# Crear entrada traduïda. Sembla més senzill de format i és més volum. Problemes: en castellà i francès hauré d'assumir que el gènere és el mateix que en català ja que no l'indica. En castellà ja tenim plantilles per la [[Plantilla:es-pron|pronúncia]] i per la flexió de [[Plantilla:es-nom|noms]] i [[Plantilla:es-adj|adjectius]] que estan provades funcionant bé gairebé sempre. En italià funcionen pronúncia i flexió a mitges, cal revisar. En anglès havia fet alguna cosa llegint l'entrada a en.wikt per copiar la plantilla del lema amb flexió. En altres llengües caldria fer plantilles de lema que facilitin la creació d'entrades noves.
Alguna idea de per on atacar? Estic en fase prèvia estudiant-ho sense haver fet res. És feina de programació de bot, preparació de la informació i posterior revisió. No sé si la podem assumir, però és una oportunitat, una forma d'avançar al Viccionari. Caldria enfocar-ho de forma senzilla que no doni problemes de revisió. El Termcat hi està interessat i pot donar més fruits. --[[Usuari:Vriullop|Vriullop]] ([[Usuari Discussió:Vriullop|discussió]]) 13:46, 5 juny 2014 (CEST)
:{{Ping|Vriullop}} Bufa! Si l'XML és CC-BY-ND no podem fer-lo servir, però no acabo de veure la llògica (alguna n'hi haurà) si l'HTML d'idèntic contingut és CC-BY. Podríeu suggerir al Termcat un canvi de la llicència de l'XML (recordeu que no hi val un tracte preferent per al Viccionari, sino que és o compatible amb CC-BY-SA, o no compatible).
:Sobre l'excés de locucions no tinc una opinió sòlida. Tenim [[:Viccionari:Compostos]] que estableix unes directrius, i són les millors mentre ningú tingui cap idea millor.
:Recordo haver revisat unes quantes locucions de [[:Categoria:Turisme|turisme]], i mentre les vaig trobar al Termcat les vaig deixar, i la resta, per ser un "tipus de" i sense cap entrada pròpia a cap diccionari, les vaig esborrar. És a dir: un tracte individual.
:No obstant, de vegades aquestes directrius es troben amb la subjectivitat dels diccionaris de referència i resulta igualment subjectiu decidir què fer a Viccionari. Per exemple, els tipus de càncer: "càncer de laringe" tindria cabuda sota aquestes directrius (perque apareix al Termcat); però "càncer de mama", igualment deduïble, tindria un punt menys per no tenir cap entrada principal a cap diccionari; no obstant, té un mot [relativament] simple en altres llengües: ''Strubekræft, Kehlkopfkrebs, Gégerák, etc.'' Creem entrada per "càncer de laringe" però no per "càncer de mama"? o per cap dels dos per ser evident que són un "tipus de" càncer?... Això em grinyola.
:Responent a la pregunta de què fer, si saltar les urticàries o no, doncs em decanto per sí saltar-les, per ser de tractament més complex. I si veus molt clar afegir-les, doncs em decanto per no saltar-les! haha!
:Per a les traduccions, es pot ignorar el gènere, o es pot posar, com dius, igual que en català. Les probabilitats d'encertar suposo que són del 99% i, en tot cas, poques són les entrades a Viccionari que queden perfectes a la primera. Ja s'anirà esmenant, si és que hi ha res per esmenar.
:El problema d'enllestir plantilles de creació ràpida en altres llengües és haver de tenir coneixements fiables d'aquestes altres llengües. És engrescador aprendre idiomes, però requereix molt de temps. Si hi ha una plantilla de mínims, és més que suficient.
:Jo veig un problema més caòtic encara, i és que ja existeixi l'entrada i s'hagi de mesclar. Això requerirà treball manual o d'AWB.
:En definitiva, jo atacaria el més senzill i assequible de tot. Posteriorment, si queden ganes, atacaria les entrades més complexes, després les xungues i finalment les recalcitrants.
:-[[Usuari Discussió:Aleator|Aleator]] 17:14, 5 juny 2014 (CEST)