Git Product home page Git Product logo

epidoc-encoder-al's Introduction

EpiDoc-Encoder-AL

EpiDoc Encoder for Ancient Languages

Türkçesi için aşağıya bakınız

This is a repository for assembling scripts that I have been using for encoding ancient languages. It is designed to facilitate encoding ancient languages to EpiDoc xml-format.

It has two major goals:

  1. Prepare text for encoding:
  • Convert texts that are transliterated following a convention of a certain historical discipline to an EpiDoc friendly format.

  • Convert texts that are transliterated following a convention of a certain online corpus (ex. C-ATF for ORACC, or MdC for TLA, CAL-code for CAL, etc.) to an EpiDoc friendly format.

  1. Provide encoded/annotated (since it is xml, we can say that that which is known as the annotation process to linguists coincides with that which is known as the encoding process to digital epigrapher) lexical items to facilitate the encoding process.
  • Warning!: The annotation/encoding provided for the lexical items is NOT the final word about their annotation/encoding within the context of the text they appear. It is up to user to verify each annotation/encoding within its context.

Targeted Languages:

  • Ancient Egyptian (and its variants, Middle Egyptian, Demotic, etc)
  • Elamite (and its variants, Neo-Elamite, Achemenid Elamite, etc)
  • Akkadian (and its variants, Paleo-Babylonian, Neo-Assyrian, etc)
  • Old Persian
  • Latin
  • Official Aramaic
  • Ancient Greek
  • Others depending on your contribution

P.S.: Though this readme is in English and Turkish, i encourage contributors use English plus their native language plus any other languages they want to add in docstrings and comments of the functions.

Eski Yakındoğu Dilleri için EpiDoc Kodlayıcısı

Bu depo eski dilleri kodlarken kullandığım betikleri derlemek için. Eski dillerdeki metinleri EpiDoc-Xml düzenine dönüştürmeyi kolaylaştırmaya çalışıyorum.

Projenin İki amacı var:

  1. Metinleri kodlamaya hazırlamak:
  • Çeşitli tarihi disiplinlerin uzlaşımları kullanılarak harf çevirisi yapılmış metinleri, EpiDoc-Xml düzenine dönüştürmesi kolay bir hale getirmek

  • İnternet ortamında bulunan çeşitli külliyatların kullandığı uzlaşımlarla (CDLI külliyatının kullandığı C-ATF, TLA'nın MdC'si, vs.) harf çevirisi yapılmış metinleri, EpiDoc-Xml düzenine dönüştürmesi kolay hale getirmek

  1. Kodlaması/notlandırması yapılmış sözcükleri kodlama sürecini kolaylaştıracak şekilde sunmak. Kodlama ile notlandırmayı aynı anlamda kullanıyorum, zira dilbilimcilerin şerh/notlandırma dedikleri süreç ile sayısal yazıtbilimcilerin kodlama diye adlandırdığı süreç, kullanılan şemal xml olduğundan dolayı aynı olaya tekabül ediyor. Aslen aynı işi yapıyorlar ama farklı bilgileri giriyorlar
  • UYARI! Sunulan kodlanmış sözcükler, onların metin içindeki bağlamları gözetilmeksizin yapıldığından, ya da kısıtlı bir bağlam gözetilerek yapıldığı için, içinde görüldükleri metin bağlamında olması gereken kodlamya sahip olduklarına dair herhangi bir garanti sunulmamaktadır. Kodlamanın metin bağlamında doğru gerçekleşip gerçekleşmediğini denetlemek kullanıcıya kalmıştır.

Hedef Diller:

  • Eski Mısırca (ve lehçeleri, Orta Krallık Mısırcası, Demotik, vs)
  • Elamca (ve lehçeleri, Yeni-Elamca, Hakağmanişiya Elamcası, vs)
  • Akatça (ve lehçeleri, Paleo-Babilce, Yeni-Asurca, vs)
  • Eski Farsça
  • Latince
  • Resmi Aramice
  • Eski Yunanca
  • Ve sizin katkılarınız sayesinde diğerleri

P.S.: Bu giriş Türkçe ve İngilizce olmasına karşın, yazılan işlemlerin belgeleme kısımlarında (docstring) ve yorum bölümlerinde İngilizce + kendi anadiliniz + eklemek istediğiniz diğer dillerin olmasını destekliyorum. Hatta bilakis teşvik ediyorum.

Susmayın,
korksanız da susmayın,
bağarmasanız da fısıldayın,
susmayın

Peace & Love,

An academic for peace

Barış, Sevgi ve Dayanışma,
Barış için bir akademisyen

epidoc-encoder-al's People

Contributors

d-k-e avatar

Watchers

 avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.