лабораторія української @f форум[рання версія
]
Проекти
┌──────────────────────────────────────────────────────────┐
│ золотий стандарт │
├────────────────────────────┐ ┌────────────────────────┤
│ корпус зі знятою омонімією │ │ банк синтаксових дерев │
│ розмічений руками ---> розмічений руками │
│ 140 000 слів │ │ 122 000 токенів │
└────────────────────────────┴────┴────────────────────────┘
│ │
┌ *демо* ────────────────────────┐
│ морфосинтаксовий аналізатор │
│ (точність морф 91% / синт 82%) │ чужомовні
└────────────────────────────────┘ аналізатори
│ │ ╱
┌────────────────────────┐ ┌────────────────────┐
│ корпуси з пошуком │ │ паралельні корпуси │
│ розмічені автоматично │ │ укр-{англ,пол,фр, │
│ ~3 млрд слів, додайте │ │ нім,ісп,порт} │
│ свій │ └────────────────────┘
└────────────────────────┘
│ │
вектори N-грами
...і дрібніші проекти.
долучаки