лабораторія української      @f   форум
[рання версія]
   
              Проекти
              
┌──────────────────────────────────────────────────────────┐
│           золотий стандарт          │
├────────────────────────────┐  ┌────────────────────────┤
│ корпус зі знятою омонімією │  │ банк синтаксових дерев │
│ розмічений руками      ---> розмічений руками   │
│ 140 000 слів        │  │ 122 000 токенів    │
└────────────────────────────┴────┴────────────────────────┘
           │          │
       ┌ *демо* ────────────────────────┐
       │ морфосинтаксовий аналізатор  │
       │ (точність морф 91% / синт 82%) │    чужомовні
       └────────────────────────────────┘    аналізатори
         │             │     ╱
   ┌────────────────────────┐    ┌────────────────────┐
   │ корпуси з пошуком   │    │ паралельні корпуси │
   │ розмічені автоматично │    │ укр-{англ,пол,фр, │
   │ ~3 млрд слів, додайте │    │   нім,ісп,порт} │
   │ свій          │    └────────────────────┘
   └────────────────────────┘    
    │        │
   вектори     N-грами
   
                   ...і дрібніші проекти.
 
долучаки