Comments (29)
これ多分、utf-16 で出力できれば ok というわけではなくて InDesign のタグとか shift-jis 前提になってるところをどうするか、というところも見る必要があったと思う。
あと web 版に http://md2inao.bloghackers.net/ にオプションを付けてあげる必要もあるかな。
from md2inao.
みなさまありがとうございます!!!
UTF-16で出力した場合は、変換後のファイルの1行目を以下にしていただく必要がございます。
<UNICODE-MAC>
あとは、実際にテキストをInDesignに読み込ませてみないとわからなさそうです。
#73 をご対応いただけるととても助かりますっ。
from md2inao.
うっ、ちなみに UTF-16 以外のoutput encodingに対応する必要はありますか?
from md2inao.
ございません。
また、UTF-16対応がうまくいきましたら、こちらのほうをデフォルトで使用させていただき、Shift-JISのほうはオプションという運用になると思います。
from md2inao.
了解です。じゃあそのへんいい感じにします!
from md2inao.
UTF-16だとそのままweb版でtextareaに出力できない予感…。convertすると画面遷移とかでもいいすかねえ?
from md2inao.
ありがとうございます。
はい、画面遷移でもいきなりダウンロードでもぜんぜん大丈夫です!
ただ欲を申せば、現状のように1つ前に選択したテキストファイルを保持しておいていただけると、すごく助かります。
現状はWeb版を以下のように使用しています。
- テキストファイルを選択
- テキストファイルを変換
- ローカルでテキストファイルを編集(記法の誤りなどを修正)
- 2~3を繰り返して試行錯誤する
4が、「1~3を繰り返す」、つまりテキストファイルの選択からやりなおすになると、ちょっとだけ不便なのです……。
from md2inao.
思い出した。自分も utf-16 対応したときこの問題にぶつかって、一旦なしにした気が。
現状、画面遷移DLじゃなく上記になっているのは、もともと画面遷移だったけどそれだと不便なんでというリクエストがあって今に至ってます。
from md2inao.
ふむふむ。
@inao さんのマシンはMacですか?今回CPAN化したことでmd2inaoのインストールが非常に簡単になりまして、もしかしたらコマンドラインから使っていただくのが効率的にはベストかもしれないです。Windowsだとちょっと…なのでその場合はWeb版を改良していきます。
from md2inao.
アドバイスありがとうございます。
僕のマシンはMacです(ただ編集部にはWindowsの人も……)。
あとでインストールに再チャレンジしてみます!
from md2inao.
hmhm Windowsは厳しいっすね、インストール自体は普通にできるんですが、ターミナルで作業するということが難しい…。
from md2inao.
ですのでWeb版もあると、編集アシスタントさんなどだれでも使えて助かるのです。
Web版はShift-JIS、ローカルはUTF16ってするのが良いかもですね。
UTF16を使いたい人は環境構築をがんばれと。
from md2inao.
横からすいません。WEB+DB PRESS編集部池田と申します。
出力をUTF化する際に、私が以前に調べた点を書きます。複雑ですいませんが、事前にお送りしておいたほうが対応いただくとなった場合の作業量などの参考になるかなと思いお書きしました。
現在、次のような流れで変換して、InDesignというDTPソフトに取り込んでいます。
markdown
↓(md2inao)
InDesingタグ付きテキスト
現在のSHIFT-JISのInDesingタグ付きテキストでは、<005C>
→\
のようなUnicode番号? で表記した文字の変換が利用できるのですが、InDesignタグ付きテキストをUTF出力のものにすると、このUnicode番号の表現が使えなくなるようです。
これで影響があるのは次のような表記です。「markdown」のように表記すると「SJISの場合の期待する動作」だとUTFでは正常にならず、「UTFの場合の期待する動作」のように変換される必要があります。下記例は本文に出てきた場合を想定しているので「ParaStyle:本文」がついています。
山括弧
markdown
<>
SJISの場合の期待する動作
<ParaStyle:本文><005C><<005C>>
UTFの場合の期待する動作
<ParaStyle:本文><>
黒丸数字
markdown
(d1)
SJISの場合の期待する動作
<ParaStyle:本文><CharStyle:丸文字><2776><CharStyle:>
UTFの場合の期待する動作
<ParaStyle:本文><CharStyle:丸文字>❶<CharStyle:>
白丸数字
markdown
(c1)
SJISの場合の期待する動作
<ParaStyle:本文><CharStyle:丸文字><2460><CharStyle:><CharStyle:丸文字>
UTFの場合の期待する動作
<ParaStyle:本文><CharStyle:丸文字>①<CharStyle:>
キーボードフォント
markdown
<kbd>Enter</kbd>
SJISの場合の期待する動作
<ParaStyle:本文><cFont:Key Mother><00A9><cFont:>
UTFの場合の期待する動作
<ParaStyle:本文><cFont:Key Mother>©<cFont:>
以下は、SJIS、UTF同一なのでこのままで大丈夫です。
黒四角数字
markdown
(s1)
SJIS、UTFの場合の期待する動作
<ParaStyle:本文><cTypeface:B><cFont:A-OTF ゴシックMB101 Pro><cotfcalt:0><cotfl:nalt,7>1<cTypeface:><cFont:><cotfcalt:><cotfl:>
黒アルファベット
markdown
(a1)
SJIS、UTFの場合の期待する動作
<ParaStyle:本文><CharStyle:丸文字><cLigatures:0><cOTFContAlt:0><cOTFeatureList:nalt,3>a<cLigatures:><cOTFContAlt:><cOTFeatureList:><CharStyle:>
このうちキーボードフォントのEnterがが©
という文字にしなければならないなどは、規則性はないようなので、必要になったらこちらでリストを作成します。
これら、私のほうで @inao が用意しているようなテストコードを書くこともできますので必要でしたら教えてください。
添付している画像がUTFのタグ付きテキストをInDesignに取り込んだもので、「文字コード番号表記」がUTFではうまく解釈できていないとろで、「そのまま文字」が上記のように表記して正常に表示できたところです。
わかりにくいところありましたらご指摘ください。
from md2inao.
あと、Unicodeにする際、
のほかに、文字コードを
- UTF16BEでCR改行
- UTF16LEでLF改行
どちらかである必要があるようです。
from md2inao.
@d-ikeda なるほどっすねー!!大変たすかります!!!!
from md2inao.
@gfx さん
いろいろ便利にしていただいてありがとうございます! こういったデータがあるとやりやすいなどありましたら用意しますので教えてください。
from md2inao.
ようするに、SJIS前提では、SJISにない文字を扱うために、ユニコード番号を< >
で取り込んで展開していたわけですね。
ユニコードを前提にするとその処理が余計なお世話になってしまう、というのが @d-ikeda さんの書いたところ。キーボードフォントも、コード番号じゃなく割り当てられた文字そのままを出す必要があるということになりますですね。
あ、どうもです。デザイナの西岡です……。
from md2inao.
あ、もしかしてコードに0x追加すればいいだけだったりしないかしら。
例えば全角スペースなら<3000>
じゃなくて<0x3000>
というふうに。
from md2inao.
@n-yuji さん
ありがとうございます! そのとおりです。
あ、もしかしてコードに0x追加すればいいだけだったりしないかしら。
例えば全角スペースなら<3000>じゃなくて<0x3000>というふうに。
これでできるとうれしいですね。試してみます。
from md2inao.
試してみました。うまくいかないようです。
試したInDesignタグテキストは以下のものです。
https://gist.github.com/d-ikeda/9482914
以下の部分が追加して試したコードです。
<ParaStyle:中見出し>0x追加
<ParaStyle:本文><0x005C><<0x005C>>
UTFで表現出来る文字はUTFで、という感じなのかもしれないですね。
from md2inao.
なるほどー!もしかして、単にUTF-16()をサポートするのがいろいろ変換の手間がなくてよい、という状況ですか?
from md2inao.
0xでいけそうな気がしたんだけどなー(InDesignタグの説明書によれば、少なくとも<0x3000>
は通るはずなのでしたが、これさえ通らないですね。これはいちおうサポートに報告しておこうと思いますけど、まったく期待はできません)。
UTFの文字にするのが良いようですね……。
from md2inao.
@n-yuji さん
0xでいけそうな気がしたんだけどなー(InDesignタグの説明書によれば、少なくとも<0x3000>は通るはずなのでしたが、これさえ通らないですね。
私のほうでも<0x3000>
もUnicode環境では解釈されないの確認できました。こちらInDesign CS6になったら挙動が変わるなどありますでしょうか。
これはいちおうサポートに報告しておこうと思いますけど、まったく期待はできません)。
UTFの文字にするのが良いようですね……。
ありがとうございます。お忙しいところすいません。UTFが良い感じがしますね。
from md2inao.
@gfx さん
なるほどー!もしかして、単にUTF-16()をサポートするのがいろいろ変換の手間がなくてよい、という状況ですか?
はい。おそらくそのようです。この場合、今Unicode番号を使って表現している部分をUnicodeの文字自体で表現するように修正いただく必要がありそうです。
あと、念のためいままでShift-JISでは変換できていたタグがUTFにしたものでも変換できるかを確認しますね。明日連絡できると思います。
from md2inao.
@n-yuji
西岡さん、ありがとうございます!
ところで、InDesign CS6なタグ付きテキストのドキュメントって、Webでも転がってますか?
ぱっと見つかるのはCS5なんですよね。
http://help.adobe.com/ja_JP/indesign/cs/taggedtext/indesign_cs5_taggedtext.pdf
電話でご相談させていただいたInDesign CS6の導入はOKが出たのです。
まだ届いていないのでCS3からいつ移行するか(移行しないもあり得る)はなんともなんですけど、CS6も視野に入れてこれらの件も進めたいと思っております。
from md2inao.
@inao さん、タグ付きテキストのドキュメントはCS5のものしか見当たらないようです。
動作の確認はCS6でもやりました。
タグ付きテキストに関してはバージョン差は少ないと思いますが、予想外の不具合が潜んでるかもしれないので、注意しないといけません。
from md2inao.
CS6のものはまだないっぽいんですね。
さっそくのお返事ありがとうございました。
from md2inao.
現在の原稿をUTFにしたときにどのくらい変換できないものがあるのか調べてみました。
https://www.dropbox.com/sh/wm56xzvy3ln4uch/qotSKTE1wF
- x_input.txt:利用したmarkdownテキスト
- UTF8testAllSjis.pdf:SJISで変換したInDesign出力
- UTF8testAllUTF.pdf:UTFで変換したInDesign出力
ほとんどそのまま変換できているのですが、やはりUnicode番号で指定しているところが変換できないようです。
この変換できない部分を昨日の形に修正していけば、UTF対応はできそうな感じです。UTF化できそう/難しそうなどの参考になれば幸いです。
from md2inao.
ラベルはhighとさせていただきました。
現在は、UTF-8で書かれている原稿を、md2inao適用後にShift-JISに変換する必要があるため、Shift-JISでは使えない文字を #69 のように<005C>
のようなUnicode番号に変換する必要があります。
このIssueを実装していただくと、その必要がなくなります。
ご執筆者にとっても、現状は黒丸数字は(d1)
などで書いていただいていますが、これらの文字をそのまま書けるようになります。
UTF-16の場合Web版での動作が問題になりますが、ブラウザ上に変換結果(InDesignテキスト)が表示されなくても大丈夫です。ダウンロードして確認できれば問題ありません。
ただ、Web版ではブラウザに警告は出力していただきたいです。
また、上述したように、「現状のように1つ前に選択したテキストファイルを保持しておいていただけると、すごく助かります。」
from md2inao.
Related Issues (20)
- 節番号の自動化
- InDesignフォームへの配置 HOT 4
- Heroku デプロイに失敗する HOT 16
- 行頭の半角スペースが全角スペースに置き換えられないようにする HOT 2
- Markdownのfootnote記法に対応してほしい
- 旧記法への変換機能を削除する?
- コードブロック中に不要な全角スペースが入る HOT 1
- コードブロック中の`[]:`がなくなる HOT 1
- 数式を使い始めました。UseMath: true HOT 2
- ...
- 表のキャプションに「表1::」などがない場合、キャプションが消える
- コラムのコードブロック中の`<tag>`がなくなる
- ulタグ単体だと変換されない
- リポジトリ招待のお礼
- Webアプリケーション版の自動デプロイ HOT 4
- 不要な半角スペースの除去 HOT 4
- 段落字下げ HOT 5
- タブ区切りのテーブル記法 HOT 1
- 注釈内のバッククォートで囲まれた中の閉じカッコは無視する
- 自動段落分け機能を削除する HOT 4
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from md2inao.