データ分析メモと北欧生活

旧Untitled Note. データ分析、計量経済・統計とR、水産管理、英語勉強、海外生活などについて備忘録や自分の勉強のOutputの場所として

MENU

MSワードからR Markdownに数式を移植するときにUnicode文字のエラーが出る問題

あんまり需要のなさそうな話だが、備忘録として書き留めておく。

ある論文を改訂するのに、マイクロソフトワードで昔書いていたのだが、分析もやり直すので思い切ってR Markdownに移植して最終的にPDFとして作ることにした。MSワードで書いたファイルをコピペしてR Markdownに移すのだが、困ったことにMSワード内での数式や記号はきちんとコピペされない。仕方ないのでその部分は手打ちで直していくわけなのだが、R Markdownをそのままつかっていると、MSワード内での記号がきちんと表示されないというか、透明で見えない。しかし、存在はしているので、デリートキーを押すと削除される。しかし、実際に削除される部分と、目に見えるカーソルのうちが異なっている。非常にわかりにくい。

これはUnicode文字のせいであるらしい。この文字を含んだままPDF変換しようとすると、texファイルには変換されるが、texからpdfに変換する段階でエラーが出る。

! Package inputenc Error: Unicode character 􏰤 (U+10FC24)
(inputenc)                not set up for use with LaTeX.

というエラーだ。

もちろん直すのだが、透明なのでどこを直せばいいかわからないし、カーソルと削除される位置が異なるのですごくイライラする。

これを「見える」ようにするにはR markdownの中で「file」→「Reopen with encoding」を選択し、encodingを選ぶ画面が出るのでWindows-1252を選択すると文字化けしたUnicode文字が見えるようになる。
あとは、検索機能なり手打ちなりでこれらの文字を削除するか、置き換えていくと解決する。