Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Common words and forms missing from LEMLAT #6

Open
nevenjovanovic opened this issue Aug 21, 2017 · 2 comments
Open

Common words and forms missing from LEMLAT #6

nevenjovanovic opened this issue Aug 21, 2017 · 2 comments
Assignees

Comments

@nevenjovanovic
Copy link

nevenjovanovic commented Aug 21, 2017

We have tested LEMLAT on a corpus of classical Latin texts from a university reading list. The corpus contains some 23,700 words and 8,538 different word forms: Terence's Adelphoe, Horace's Odes Bk. 1, Tibullus Bk. 1, Seneca's Letters Bk. 1 (all editions from the PerseusDL collection). Beside various forms of personal names (and some typos in our sources), there were 40 word forms not recognized by LEMLAT; a tiny percent of all forms -- but the list is below. Some reasons for not recognizing the forms seem to be orthographical (ë, omitted -p- in emta, demsi, oe in foeneraret; words joined instead of separated -- illiusmodi). Some have to do with meter in comedy - the elided -n', from -ne, is regularly not recognized by LEMLAT. Some missing forms are fairly common: norimus, nosse.

I propose that the forms from the list below be added to the LEMLAT database.


adteruisse
audistin
coëmisse
demseris
demsi
egon
emta
emtae
emtam
foeneraret
haecine
hancine
hocine
hoscine
illan
illiusmodi
ipsus
lucu
men
norimus
nosse
nossem
nostin
numquidnam
poëta
poëtae
posthaec
propediem
quamobrem
quamprimum
quandoquidem
quorundam
quotannis
refrixerit
sumtuosa
tamdiu
tantummodo
tercentenas
tetigin
tun

@passarom
Copy link
Member

passarom commented Aug 21, 2017 via email

@passarom
Copy link
Member

passarom commented Apr 3, 2020

Per apportare questa modifica, si tenga conto che si tratta di una modifica che impatta LEMLAT e solo potenzialmente anche il lemmario di LiLa.

La lista di Neven è una lista di forme non riconosciute da LEMLAT. Non sono lemmi e non impattano il lemmario LiLa, se non nei due casi qui sotto descritti.
Se si vuole apportare una modifica per risolverle, bisogna apportarla in LEMLAT: e le tipologie di modifica sono molteplici, e.g. nuove forme eccezionali, nuovi les con codles flessivi, aggiunte di a_gra, etc.

Impatto sul lemmario di LiLa:

  • solo nel momento in cui una forma della lista di Neven richieda che vada inserito un nuovo lemma, esso va inserito anche in LiLa;
  • solo nel momento in cui una forma della lista di Neven richieda che vada inserita una nuova forma di citazione (non solo forma, ma “forma di citazione”, i.e. forma del lemma) di un lemma esistente, essa va inserita come nuova wr di quel lemma in LiLa.

Flavio è la persona più giusta per apportare modifiche a LEMLAT, perché ha ben chiaro il quadro complessivo delle tabelle del lemlat_db.
Assieme a lui deciderò un momento (auspicabilmente a fine emergenza COVID-19) dedicato a una campagna di:
(a) aggiornamento di LEMLAT con i nuovi lemmi inseriti nel lila_db (identificati con un codice src che li trova in modo non ambiguo);
(b) aggiornamento di LEMLAT con le modifiche necessarie per far fronte alla lista di Neven.

Ricordo che si inseriscono in LiLa nuovi lemmi/wr solo se si realizza una di queste condizioni:

  • allacciamento di una risorsa che richieda nuovi lemmi/wr;
  • inserimento in LEMLAT di nuovi lemmi, o forme di citazione di lemmi esistenti.
    Questo è dovuto alla necessità di fare campagne organiche di modifica del lemmario e non a spot.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants