MSワードからR Markdownに数式を移植するときにUnicode文字のエラーが出る問題
あんまり需要のなさそうな話だが、備忘録として書き留めておく。
ある論文を改訂するのに、マイクロソフトワードで昔書いていたのだが、分析もやり直すので思い切ってR Markdownに移植して最終的にPDFとして作ることにした。MSワードで書いたファイルをコピペしてR Markdownに移すのだが、困ったことにMSワード内での数式や記号はきちんとコピペされない。仕方ないのでその部分は手打ちで直していくわけなのだが、R Markdownをそのままつかっていると、MSワード内での記号がきちんと表示されないというか、透明で見えない。しかし、存在はしているので、デリートキーを押すと削除される。しかし、実際に削除される部分と、目に見えるカーソルのうちが異なっている。非常にわかりにくい。
これはUnicode文字のせいであるらしい。この文字を含んだままPDF変換しようとすると、texファイルには変換されるが、texからpdfに変換する段階でエラーが出る。
! Package inputenc Error: Unicode character (U+10FC24) (inputenc) not set up for use with LaTeX.
というエラーだ。
もちろん直すのだが、透明なのでどこを直せばいいかわからないし、カーソルと削除される位置が異なるのですごくイライラする。
これを「見える」ようにするにはR markdownの中で「file」→「Reopen with encoding」を選択し、encodingを選ぶ画面が出るのでWindows-1252を選択すると文字化けしたUnicode文字が見えるようになる。
あとは、検索機能なり手打ちなりでこれらの文字を削除するか、置き換えていくと解決する。