Git Product home page Git Product logo

neru_corpus's People

Contributors

anrom7 avatar diana-bahen avatar makovetska avatar markiyanvol avatar mokhonova avatar olgastr avatar sionko avatar sophia-sosnova avatar

Stargazers

 avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

neru_corpus's Issues

розрохункова

доброго дня. якщо я перетворюю txt в utf - 8 і загружаю його в gate то в мене програма не читає цього документу. а без кодування utf -8 читає. що мені тоді робити?

Чи можливе дублювання token? Дякую

(Named Entity) потрібно виділити тегом token. АЛЕ лише тегом token, не вказуючи features (pos, lemma, morphology).

  1. А коли ми робимо морфологічний розбір (Named Entity) за умови переліку, скорочений варіант залишати?
  2. Чи два token можливі? Це правильно?
    Дякую

вул. Коновальця

Скажіть, будь ласка, контекст:" ...що на Коновальця..." визначати так
token {lemma=Коновалець, morphology=Npmsln, pos=N} ???

Питання щодо усіх відгуків

  1. чи потрібно маркувати бістро, кондитерська, і я кщо так , то маркування organization-token?
  2. як маркувати Стрийський ринок?
    3)м ясо на грилі, салат з капусти - прийменники також маркуються? І як маркувати назви закладів Арт-Боді та Зе Гріль?
    4)Як маркувати піца Цезар, пляшка мінеральної води?Дякую

Підкажіть, будь ласка!!!

картопля смажена, смажений хек, грильовим м"ясом, крем масляний, чорного хліба - маркувати все разом як food, чи брати тільки окремі слова: картопля, хек, м"ясо, крем, хліб...???

розрахункова_запитання

Доброго вечора, Андрій Богданович.
1.Коли слово повторюється 2-3 рази в тексті, маркувати і визначати тип щоразу?
2. Аmigo(KK) - тип організація, token - не визначати, бо не кирилиця. Так?
3. ель греко - організація, token - не визначати, так?

Абревіатура_як маркувати підкажіть будь ласка?

За даними Всесвітньої організації охорони здоров'я (ВООЗ) у світі налічується..
Всесвітньої організації охорони здоров'я -маркую organizaion,+ token
(ВООЗ) - беру теж як організація та додаю токен
і далі 2 слова та перед маркую за усіма моргфологічним ознаками
Такий розбір правильний?
Дякую.

Скажіть, будь ласка.

Скажіть, будь ласка:

  1. “Обсипало на тілі плямками” , “ кал став зелений ”, ” щоки теж обсипало, але дрібними червоними прищиками ”, ” спина обсипана ”- всі слова маркувати як симптоми? А потім окремо токени?
  2. “сильний свербіж” – слово “сильний” також маркувати до симпотому?
  3. Чи потрібно маркувати наступне. А якщо потрібно, то як? “атопічний дерматит на фоні дисбактеріозу кишківника”, “аналіз на гельмінти (аскариди, токсокари, лямблії)”, “загальний аналіз крові з лейкоцитарною формулою”, “мазок із зіву на мікрофлору”.
    Дякую.

[neru_med][відгуки]

long mail, grab coffee

Доброго дня!
Маю декілька запитань:

  1. "Хронічний" слово стоїть в речення без хвороби, але це контекст гастриту. Маркувати як симптом, хворобу? Чи взагалі не маркувати?
  2. "З 12 до 18 років" маркуємо як період разом з прийменниками?
  3. "2 рази", "2 рази на тиждень" в контексті частоти маркути як період чи ні?
  4. Якщо хвороба перекладена кількома словами, але дослівно, то маркувати все слосполучення прийменником як хворобу? ("в 12-палій кишці запалена цибулина" це фактично дуоденіт)
  5. Ферменти зараховують до treatment чи drag? "уколи мукози" може бути як перше, так і просто "мукози" як друге. Я б маркувала "уколи мукози" як treatment.. Чи подвійно?

6.Якщо симптом розкиданий по тексту, то маркуємо його? Чи не рухаємо?
"Живіт (4слова) болить"

  1. "коли нагинається сильна давка на горло" все словосполучення врахувати як симптом?
  2. Що робити з російськомовним текстом?

Дякую, що дочитали :)
Чекаю на відповідь.

З повагою,
Іванна Кушнірук

Терміни гіперліпідемія, ортостатична гіпотонія не є (Named Entity) , бо не є захворюваннями? Так? Дякую.

Чи правильно я розумію, що терміни гіперліпідемія, ортостатична гіпотонія, які мають ознаки певних відхилень або розладів, не маркуються як (Named Entity) , бо не є захворюваннями?
Дякую.

питання щодо нікнейму

це імя вигадане, тому перша інформація була така, що ми не виділяємо token, і не маркуємо жоден нікнейм.
Якщо зараз теба виділяти токен, і маркувати, то це стосується лише слова кирилицею?
Якщо ще якісь умови, то хотілося б отримати детальнішу інформацію.
Дякую.

Help please

Скажіть будь ласка, р-н Левандівка маркувати як Address - Street, чи Location - Rerion ?

питання щодо усіх моїх відгуків:

1)скажіть, будь ласка, чи потрібно писати token до нікнеймів, якщо вони є кирилицею,н-д: Руда Лисиця?
2)і чи такі речі як "15, 20 грн."---money-------->token----->lemma-гривня, Ncfpnn?
3)салат цезар-------виділяти разом food, token -окремо до кожного слова потім писати(цезар маркувати в token-------> Npmsny?)
4)у контексті: "Фраєрку
підкажіть,будь ласка, де то є?" слово Фраєрку---------organization---->token-->Npfsan(lemma---фраєрка)?
5)у контексті: "піцерії " Тралі - Валі " Піноккіо" як правильно маркувати ці слова?
6)чи потрібно маркувати тут кожне слово -----food: "суп-крем із шпинату з лососем, суп з лосося "Буйабесс"-нормально, як звичайна зупка, хіба з смачненьким лососем...........качка з фруктовим салатом...........манюсінький кусочок качки......овочі-фрукти.....соус-джем.......соки.....шматочки тортиків.....ванільні печенька з молочним шоколадом........салат-мікс з горішками......салатик з латуком, чері і ще якоюсь травичкою.......медальйони з телятини в беконі.....фуа-гра під грушевим соусом......яблучні струделі з морозивом і горішками.....капучіно..."?
7) чи потрібно маркувати token такі назви організацій: Маккафе, Деліс, Макдональдс?
8)таку організацію як (паб): Динамо-блюз----organization------2 token for words?
9) контекст : у програмі Ревізор--------чи потрібно це якось взагалі маркувати?
на Новому каналі------organization----token for "Новий" чи і для "канал"?

дякую.

Чи терміни гіперліпідемія, ортостатична гіпотонія будуть (Named Entity) в контексті? Дякую.

Наукові дослідження продемонстрували наявність певних чинників ризику виникнення та наростання захворювання, а саме:
....

  • наявність супровідної судинної патології (збільшення опору судин і порушення авторегуляції - гіпертонічна хвороба, діабет, вазоспазм, атеросклероз, гіперліпідемія, збільшення в'язкості крові; зниження перфузійного тиску - судинна дистонія, ортостатична гіпотонія, нічні падіння артерійного тиску (AT)
    тут або все, або вибірково? (зазворювання або симптом) падіння артерйного тиску - це симптом ? так?
    Дякую.

вул. Коновальця

Скажіть, будь ласка, контекст:" ...що на Коновальця..." визначати так
token {lemma=Коновалець, morphology=Npmsln, pos=N} ???

HELP!

"cоєвий соус" робити, як food----2 token for 'соєвий', and "соус"?
і чи потрібно токени для "локшина з вершками і шпинатом"?

підкажіть, будь ласка!

Чи потрібно маркувати таке у контексті: "відсвяткувати 20-ліття"--------time--->period----->lemma-??Y----?
і чи 20-потрібно маркувати числівником?

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.