інститут української      @f   форум
[рання версія]
      
                            Проекти
                            
┌──────────────────────────────────────────────────────────┐
│                      золотий стандарт                    │
├────────────────────────────┐    ┌────────────────────────┤
│ корпус зі знятою омонімією │    │ банк синтаксових дерев │
│ розмічений руками           --->  розмічений руками      │
│ 130 000 слів               │    │ 100 000 токенів        │
└────────────────────────────┴────┴────────────────────────┘
                     │                   │
             ┌ *демо* ────────────────────────┐
             │ морфосинтаксовий аналізатор    │
             │ (точність морф 91% / синт 82%) │       чужомовні
             └────────────────────────────────┘       аналізатори
                 │                         │         ╱
     ┌────────────────────────┐       ┌────────────────────┐
     │ корпуси з пошуком      │       │ паралельні корпуси │
     │ розмічені автоматично  │       │ укр-{англ,пол,фр,  │
     │ ~3 млрд слів, додайте  │       │      нім}          │
     │ свій                   │       └────────────────────┘
     └────────────────────────┘       
        │               │
     вектори         N-грами
     
                                      ...і дрібніші проекти.
  
долучаки