Користувач:Renamerr/Ботозаливка

Матеріал з Вікісловника

Обговорення ботозаливки (історія)

  1. ВС:Форум/Архів#Імпорт_існуючих_словників (січень 2009)
  2. ВС:Форум/Архів#Населені_пункти (травень 2009)
  3. ВС:Форум#Щодо_копіювання_даних_на_Вікідані (жовтень 2019)

Джерела для ботозаливки:

  1. ВЕСУМ і проект dict_uk.
  2. Граматичний словник mphdict (документація, тека баз даних *.db) і програма SQLite Expert для роботи з базами даних.
  3. ЕСУМ — Електронні словники української мови (граматичний словник, словник синонімів, етимологічний словник) серії "Цифрове лексикографічне надбання України" (локальна десктопна версія на Гуртом'і, завантажити архів для Windows 7-10).
  4. Словник УМІФ НАН України і список слів з числовими ідентифікаторами (див. включення шаблона {{ulif}}).
  5. Словник СУМ-11 (див. включення шаблона {{СУМ-11}}).
  6. Словник СУМ-20 (наразі томи 1-11, А-ОЯ́СНЮВАТИ)
  7. Словник UA (пише, що "дозвіл на використання [СУМ-11] люб'язно надано [йому] Інститутом Мовознавства ім. О.О.Потебні").

Ідея ботозаливки

  1. Вибрати один з потенційно найвживаніших шаблонів словозміни Вікісловника.
     Зроблено Вибрано Шаблон:прикм uk 1a. Цьому шаблону відповідає словозмінний клас 2302 проекту mphdict (обґрунтування відповідності див. на сторінці Словозмінний клас 2302)
  2. Вибрати клас/субклас і теги dict_uk, що відповідають цьому шаблону.
    Не зроблено У ВЕСУМ не знайти наголоси, а для шаблона Шаблон:прикм uk 1a треба вилучати слова з наголосом на закінченні -ий.
  3. Cтворити список нових статей, що відповідають вибраному шаблону.
     Зроблено список на основі граматичного словника ЕСУМ. Див. також приклади назв статей.
  4. Створити список всіх лексем українською мовою (Q8798) на Вікіданих (запит https на WDQS для лексичної категорії прикметників (Q34698), те саме для всіх лексичних категорій). Приклад лексеми-прикметника українською мовою - "красивий". Вікікнига з описом лексикографічних даних.
     # українські прикметники
     SELECT ?lexemeId ?lemma WHERE {{
      ?lexemeId <http://purl.org/dc/terms/language> wd:Q8798;
      wikibase:lemma ?lemma;
      wikibase:lexicalCategory wd:Q34698; 
     }}
    
  5. Наповнити вмістом і створити нові статті.

Алгоритм формування вікітексту статті Вікісловника

  1. Вивести рядки
    {{=uk=}}
    ===Морфологічні та синтаксичні властивості===