肯定是乱码啊...那是因为docx 里面的东西其实进行过某些格式整合到一起的文件 你可以把一个word文件的后缀改成zip 解压缩打开看一下就知道...
java读取docx里面的东西 可以使用 poi ,具体怎么做可以在网上搜一下
读出来的东西,你重新编码一下,再打,就应该没问题了。
docx其实是一个zip文件。
设置编码
File file = new File(文件路径);
InputStreamReader read = new InputStreamReader(new FileInputStream(file),编码);
BufferedReader br = new BufferedReader(read);