Git Product home page Git Product logo

Comments (29)

naoya avatar naoya commented on July 19, 2024

これ多分、utf-16 で出力できれば ok というわけではなくて InDesign のタグとか shift-jis 前提になってるところをどうするか、というところも見る必要があったと思う。

あと web 版に http://md2inao.bloghackers.net/ にオプションを付けてあげる必要もあるかな。

from md2inao.

inao avatar inao commented on July 19, 2024

みなさまありがとうございます!!!

UTF-16で出力した場合は、変換後のファイルの1行目を以下にしていただく必要がございます。

<UNICODE-MAC>

あとは、実際にテキストをInDesignに読み込ませてみないとわからなさそうです。
#73 をご対応いただけるととても助かりますっ。

from md2inao.

gfx avatar gfx commented on July 19, 2024

うっ、ちなみに UTF-16 以外のoutput encodingに対応する必要はありますか?

from md2inao.

inao avatar inao commented on July 19, 2024

ございません。

また、UTF-16対応がうまくいきましたら、こちらのほうをデフォルトで使用させていただき、Shift-JISのほうはオプションという運用になると思います。

from md2inao.

gfx avatar gfx commented on July 19, 2024

了解です。じゃあそのへんいい感じにします!

from md2inao.

gfx avatar gfx commented on July 19, 2024

UTF-16だとそのままweb版でtextareaに出力できない予感…。convertすると画面遷移とかでもいいすかねえ?

from md2inao.

inao avatar inao commented on July 19, 2024

ありがとうございます。
はい、画面遷移でもいきなりダウンロードでもぜんぜん大丈夫です!

ただ欲を申せば、現状のように1つ前に選択したテキストファイルを保持しておいていただけると、すごく助かります。

現状はWeb版を以下のように使用しています。

  1. テキストファイルを選択
  2. テキストファイルを変換
  3. ローカルでテキストファイルを編集(記法の誤りなどを修正)
  4. 2~3を繰り返して試行錯誤する

4が、「1~3を繰り返す」、つまりテキストファイルの選択からやりなおすになると、ちょっとだけ不便なのです……。

from md2inao.

naoya avatar naoya commented on July 19, 2024

思い出した。自分も utf-16 対応したときこの問題にぶつかって、一旦なしにした気が。

現状、画面遷移DLじゃなく上記になっているのは、もともと画面遷移だったけどそれだと不便なんでというリクエストがあって今に至ってます。

from md2inao.

gfx avatar gfx commented on July 19, 2024

ふむふむ。

@inao さんのマシンはMacですか?今回CPAN化したことでmd2inaoのインストールが非常に簡単になりまして、もしかしたらコマンドラインから使っていただくのが効率的にはベストかもしれないです。Windowsだとちょっと…なのでその場合はWeb版を改良していきます。

from md2inao.

inao avatar inao commented on July 19, 2024

アドバイスありがとうございます。
僕のマシンはMacです(ただ編集部にはWindowsの人も……)。
あとでインストールに再チャレンジしてみます!

from md2inao.

gfx avatar gfx commented on July 19, 2024

hmhm Windowsは厳しいっすね、インストール自体は普通にできるんですが、ターミナルで作業するということが難しい…。

from md2inao.

inao avatar inao commented on July 19, 2024

ですのでWeb版もあると、編集アシスタントさんなどだれでも使えて助かるのです。

Web版はShift-JIS、ローカルはUTF16ってするのが良いかもですね。
UTF16を使いたい人は環境構築をがんばれと。

from md2inao.

d-ikeda avatar d-ikeda commented on July 19, 2024

横からすいません。WEB+DB PRESS編集部池田と申します。

出力をUTF化する際に、私が以前に調べた点を書きます。複雑ですいませんが、事前にお送りしておいたほうが対応いただくとなった場合の作業量などの参考になるかなと思いお書きしました。

現在、次のような流れで変換して、InDesignというDTPソフトに取り込んでいます。

markdown
↓(md2inao)
InDesingタグ付きテキスト

現在のSHIFT-JISのInDesingタグ付きテキストでは、<005C>\のようなUnicode番号? で表記した文字の変換が利用できるのですが、InDesignタグ付きテキストをUTF出力のものにすると、このUnicode番号の表現が使えなくなるようです。

これで影響があるのは次のような表記です。「markdown」のように表記すると「SJISの場合の期待する動作」だとUTFでは正常にならず、「UTFの場合の期待する動作」のように変換される必要があります。下記例は本文に出てきた場合を想定しているので「ParaStyle:本文」がついています。

山括弧

markdown

<>

SJISの場合の期待する動作

<ParaStyle:本文><005C><<005C>>

UTFの場合の期待する動作

<ParaStyle:本文><>

黒丸数字

markdown

(d1)

SJISの場合の期待する動作

<ParaStyle:本文><CharStyle:丸文字><2776><CharStyle:>

UTFの場合の期待する動作

<ParaStyle:本文><CharStyle:丸文字>❶<CharStyle:>

白丸数字

markdown

(c1)

SJISの場合の期待する動作

<ParaStyle:本文><CharStyle:丸文字><2460><CharStyle:><CharStyle:丸文字>

UTFの場合の期待する動作

<ParaStyle:本文><CharStyle:丸文字>①<CharStyle:>

キーボードフォント

markdown

<kbd>Enter</kbd>

SJISの場合の期待する動作

<ParaStyle:本文><cFont:Key Mother><00A9><cFont:>

UTFの場合の期待する動作

<ParaStyle:本文><cFont:Key Mother>©<cFont:>

以下は、SJIS、UTF同一なのでこのままで大丈夫です。

黒四角数字

markdown

(s1)

SJIS、UTFの場合の期待する動作

<ParaStyle:本文><cTypeface:B><cFont:A-OTF ゴシックMB101 Pro><cotfcalt:0><cotfl:nalt,7>1<cTypeface:><cFont:><cotfcalt:><cotfl:>

黒アルファベット

markdown

(a1)

SJIS、UTFの場合の期待する動作

<ParaStyle:本文><CharStyle:丸文字><cLigatures:0><cOTFContAlt:0><cOTFeatureList:nalt,3>a<cLigatures:><cOTFContAlt:><cOTFeatureList:><CharStyle:>

このうちキーボードフォントのEnterがが©という文字にしなければならないなどは、規則性はないようなので、必要になったらこちらでリストを作成します。

これら、私のほうで @inao が用意しているようなテストコードを書くこともできますので必要でしたら教えてください。

添付している画像がUTFのタグ付きテキストをInDesignに取り込んだもので、「文字コード番号表記」がUTFではうまく解釈できていないとろで、「そのまま文字」が上記のように表記して正常に表示できたところです。
utf

わかりにくいところありましたらご指摘ください。

from md2inao.

d-ikeda avatar d-ikeda commented on July 19, 2024

あと、Unicodeにする際、

#30 (comment)

のほかに、文字コードを

  • UTF16BEでCR改行
  • UTF16LEでLF改行

どちらかである必要があるようです。

from md2inao.

gfx avatar gfx commented on July 19, 2024

@d-ikeda なるほどっすねー!!大変たすかります!!!!

from md2inao.

d-ikeda avatar d-ikeda commented on July 19, 2024

@gfx さん
いろいろ便利にしていただいてありがとうございます! こういったデータがあるとやりやすいなどありましたら用意しますので教えてください。

from md2inao.

n-yuji avatar n-yuji commented on July 19, 2024

ようするに、SJIS前提では、SJISにない文字を扱うために、ユニコード番号を< >で取り込んで展開していたわけですね。
ユニコードを前提にするとその処理が余計なお世話になってしまう、というのが @d-ikeda さんの書いたところ。キーボードフォントも、コード番号じゃなく割り当てられた文字そのままを出す必要があるということになりますですね。

あ、どうもです。デザイナの西岡です……。

from md2inao.

n-yuji avatar n-yuji commented on July 19, 2024

あ、もしかしてコードに0x追加すればいいだけだったりしないかしら。
例えば全角スペースなら<3000>じゃなくて<0x3000>というふうに。

from md2inao.

d-ikeda avatar d-ikeda commented on July 19, 2024

@n-yuji さん

ありがとうございます! そのとおりです。

あ、もしかしてコードに0x追加すればいいだけだったりしないかしら。
例えば全角スペースなら<3000>じゃなくて<0x3000>というふうに。

これでできるとうれしいですね。試してみます。

from md2inao.

d-ikeda avatar d-ikeda commented on July 19, 2024

試してみました。うまくいかないようです。

2014-03-11 19 08 38

試したInDesignタグテキストは以下のものです。
https://gist.github.com/d-ikeda/9482914

以下の部分が追加して試したコードです。

<ParaStyle:中見出し>0x追加
<ParaStyle:本文><0x005C><<0x005C>>

UTFで表現出来る文字はUTFで、という感じなのかもしれないですね。

from md2inao.

gfx avatar gfx commented on July 19, 2024

なるほどー!もしかして、単にUTF-16()をサポートするのがいろいろ変換の手間がなくてよい、という状況ですか?

from md2inao.

n-yuji avatar n-yuji commented on July 19, 2024

0xでいけそうな気がしたんだけどなー(InDesignタグの説明書によれば、少なくとも<0x3000>は通るはずなのでしたが、これさえ通らないですね。これはいちおうサポートに報告しておこうと思いますけど、まったく期待はできません)。
UTFの文字にするのが良いようですね……。

from md2inao.

d-ikeda avatar d-ikeda commented on July 19, 2024

@n-yuji さん

0xでいけそうな気がしたんだけどなー(InDesignタグの説明書によれば、少なくとも<0x3000>は通るはずなのでしたが、これさえ通らないですね。

私のほうでも<0x3000>もUnicode環境では解釈されないの確認できました。こちらInDesign CS6になったら挙動が変わるなどありますでしょうか。

これはいちおうサポートに報告しておこうと思いますけど、まったく期待はできません)。
UTFの文字にするのが良いようですね……。

ありがとうございます。お忙しいところすいません。UTFが良い感じがしますね。

from md2inao.

d-ikeda avatar d-ikeda commented on July 19, 2024

@gfx さん

なるほどー!もしかして、単にUTF-16()をサポートするのがいろいろ変換の手間がなくてよい、という状況ですか?

はい。おそらくそのようです。この場合、今Unicode番号を使って表現している部分をUnicodeの文字自体で表現するように修正いただく必要がありそうです。

あと、念のためいままでShift-JISでは変換できていたタグがUTFにしたものでも変換できるかを確認しますね。明日連絡できると思います。

from md2inao.

inao avatar inao commented on July 19, 2024

@n-yuji
西岡さん、ありがとうございます!

ところで、InDesign CS6なタグ付きテキストのドキュメントって、Webでも転がってますか?
ぱっと見つかるのはCS5なんですよね。

http://help.adobe.com/ja_JP/indesign/cs/taggedtext/indesign_cs5_taggedtext.pdf

電話でご相談させていただいたInDesign CS6の導入はOKが出たのです。
まだ届いていないのでCS3からいつ移行するか(移行しないもあり得る)はなんともなんですけど、CS6も視野に入れてこれらの件も進めたいと思っております。

from md2inao.

n-yuji avatar n-yuji commented on July 19, 2024

@inao さん、タグ付きテキストのドキュメントはCS5のものしか見当たらないようです。
動作の確認はCS6でもやりました。
タグ付きテキストに関してはバージョン差は少ないと思いますが、予想外の不具合が潜んでるかもしれないので、注意しないといけません。

from md2inao.

inao avatar inao commented on July 19, 2024

CS6のものはまだないっぽいんですね。
さっそくのお返事ありがとうございました。

from md2inao.

d-ikeda avatar d-ikeda commented on July 19, 2024

現在の原稿をUTFにしたときにどのくらい変換できないものがあるのか調べてみました。

https://www.dropbox.com/sh/wm56xzvy3ln4uch/qotSKTE1wF

  • x_input.txt:利用したmarkdownテキスト
  • UTF8testAllSjis.pdf:SJISで変換したInDesign出力
  • UTF8testAllUTF.pdf:UTFで変換したInDesign出力

ほとんどそのまま変換できているのですが、やはりUnicode番号で指定しているところが変換できないようです。
この変換できない部分を昨日の形に修正していけば、UTF対応はできそうな感じです。UTF化できそう/難しそうなどの参考になれば幸いです。

from md2inao.

inao avatar inao commented on July 19, 2024

ラベルはhighとさせていただきました。

現在は、UTF-8で書かれている原稿を、md2inao適用後にShift-JISに変換する必要があるため、Shift-JISでは使えない文字を #69 のように<005C>のようなUnicode番号に変換する必要があります。
このIssueを実装していただくと、その必要がなくなります。

ご執筆者にとっても、現状は黒丸数字は(d1)などで書いていただいていますが、これらの文字をそのまま書けるようになります。

UTF-16の場合Web版での動作が問題になりますが、ブラウザ上に変換結果(InDesignテキスト)が表示されなくても大丈夫です。ダウンロードして確認できれば問題ありません。

ただ、Web版ではブラウザに警告は出力していただきたいです。
また、上述したように、「現状のように1つ前に選択したテキストファイルを保持しておいていただけると、すごく助かります。」

from md2inao.

Related Issues (20)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.