ブログ

  1. トップ
  2. ブログ
  3. テキスト処理ツール「so-zou.jp」で原稿を校正+WEB用に整えてみる

Webサービス

テキスト処理ツール「so-zou.jp」で原稿を校正+WEB用に整えてみる

WEBページの文字は後からでも簡単に修正できるとはいえ、納品後に全ページにバラバラと誤字脱字や半角・全角が混じっていたとなれば結構時間のかかる作業になります。

全ページに原稿を入稿してからお客様にチェックしていただく段取りで制作することも多いのですが、入稿してしまっていると修正するのも大変です。できればCMSへの入稿前に、原稿を整えておくと作業負担が軽減されます。

また、1つ、2つの誤字脱字でもユーザー様には「不安感」「不信感」を感じてしまうこともあります。WEBサイトの信頼に関わることもありますので、できれば入稿前、入稿後とWチェックしたいところです。

原稿の基本的なチェックはWordを使えば、「校正」機能があり、誤字・脱字や日本語の使用方法の誤りなどは自動チェックされます。

ただ、既にネット上にアップしてしまった原稿やスマホでチェックをかけたいときなどは、Wordではなくインターネット上のツールを使うと便利です。

今回は登録なしで使用でき、動作も軽い「so-zou.jp」のテキスト処理ツールの機能や特徴、使い方をご紹介します。


■URL:https://so-zou.jp/web-app/text/
■無料、会員登録不要

かなり長い間運営されていますが、随時メンテナンスされていて、快適に使うことができます。Yahoo!のデベロッパーツールの中のテキスト解析Web APIを利用されています。

いくつか機能がありますので、↑ツール内のサイドメニューに記載されている上から順にご紹介していきます。

※注意:このツールに関わらず、文章校正ツールを使える文章は個人情報や機密情報が含まれていないものに限ります。今後WEBで公開する予定の原稿などは問題ないですが、社内文書等はお気をつけください。

1.キーフレーズ抽出

文章の中から、特徴的なワードをピックアップしてくれます。
それぞれのワードの重要度をプログラムがチェックして、抽出し、順番に並べてくれます。

SEO対策分野でいわれるキーワードツールとは違い、それぞれのワードに割り当てられた重要度の高い順に並びます。SEO対策に使うというよりは、その文章のポイント、伝えたいことを読み取るのに便利です。

クライアント様からいただいた原稿が長い場合、たくさんある場合、要点をつかむために役に立ちます。文章の”読みどころ”がわかるので、例えば文章を元にキャッチコピーや見出しをつくるとき、的を外さずつくることができます。

ちなみにダミー文章を解析した結果、重要度の高い単語の上位3つは以下のとおりでした。

・番人 100
・Uターン 81
・新卒 63

ツールがいちばん重要度が高いと設定した「番人」というワードを100とし、それ以下のワードの数値は100以下で相対的に決まるそうです。

2.形態素解析

文章を最小単位(名詞、形容詞、助詞など)で抽出して、種類ごとに分けてくれる機能です。


文章の編集にはそれほど必要がない機能かもしれません。
プログラミングで文章を処理する際には、このように文章を切り分けていくことが大切なので、参考程度にご確認ください。

3.文章校正

ディレクター、編集者にはこの機能がいちばん役立ちます。
日本語の誤った表現や、ミスなどを見つけられる機能です。

検査対象の文章の枠にチェックしたい文章をコピー&ペースト。
【検査】のボタンを押すと、画面下に結果が表示されます。

話し言葉のように文章を書いていると、実は助詞が不足しがちです。
ここでは「縁あって→縁があって」のほうが表現としては適切かもしれないですね。また、「うどん巡り」は1つのフレーズなので、ここは助詞がなくても大丈夫だと思います。

このようにツールを通すと、文章の意味だけでなく表現方法として第三者の目でチェックしてくれるので、どの表現が最適か?と改めて考える機会になります。もちろんほとんどの場合で意味は伝わりますが、正しい表現についておいたほうが、訪問者さまからの信頼度がアップすると思います。

■公開されている記事をチェックする場合
このテキスト処理ツールには、独自機能としてURLから文章を読み込んでチェックしてくれるツールがあります。もう入稿している場合は、この読み込み機能が便利です。※公開されていない記事(ベーシック認証等で保護されている場合)は、読み込みできずエラーが返ってきます。

登録商標、略語のチェックなどは助かりますね。
wifi→Wi-Fiの他にも、ウォシュレット→温水洗浄便座、宅急便→宅配便などがピックアップされてました。言い換え候補も出てくるので、調べ直すことなく書き換えができて助かります。

4.エンコード / デコード

テキストが一括して各種文字コードで変換されます。

日本語URLを作成したり、編集したりするときに使うことが多いでしょうか。
変換ボタンでパッと出てくるので、あとは変換された部分をコピーするだけ。日本語URLの取り扱いが楽になります。

日本語URLは検索エンジン上では読みやすく便利ですが、Twitterに直接リンクを貼っても機能しないなどデメリットがあります。そのため、SNS等へ流す際にはエンコードして本来のURLに変換してから投稿する必要があります。

5.全角半角 変換

文章中の全角と半角をそれぞれ変換してくれます。
いろんな方が書いた原稿を集めてきたとき、全角、半角がそろっていない…ことってありますよね。

Wordにも同じような機能がありますが、ブラウザでパッと直せると気持ちが良いです。数字、英字、カナなど選んで変更可能です。社内規定で日付など数字が全角という企業さまもありますので、半角に直せる機能はかなり役立っています。

※この項目以降、文章編集に直接関係がないかもしれませんが、WEB制作には比較的便利な機能なので、引き続きご紹介致します。

6.タブ→スペース変換

Wordなどのテキスト作成ソフトで余白のためにタブキーで空白を作られている部分に対して、スペースキーで空けた余白に変換する機能です。

データとして扱いやすくなることと、タブキーで空いた余白とスペースキーで空いた余白でズレが出るのを防げます。

7.HTML変換/リスト形式に変換

テキストで打たれたリストを、HTMLコードに変換できます。
クライアントから来た原稿をブログ投稿する、などのときに一気に変換できるので投稿作業が時短できます。

WordPressにはリストをアイコンから挿入する機能も備わっていますので、どちらが速いか…難しいところではありますが、たくさん項目があるときは、こちらの一括変換機能が便利です。

8.HTML変換/テーブルへの変換

こちらも上記に続き、テキストで書かれたものをHTMLコードに変換する機能です。コンマ等で区切られたテキストを、tableタグを使って成形してくれます。

classやID設定を付けるなど細かいことはできないのですが、tableタグに簡単に変換できます。

まとめ

プログラミングの分野にテキストマイニングという領域があるように、文章も視点を変えればデータです。
ツールを使えば成形したり表現が適切かどうかチェックしたりすることができます。

WEB制作時には原稿作成やご提供いただくことが必須の工程ですが、ライターさんに全てのページを発注すれば半角・全角のブレや助詞の抜けなどは基本的にありませんが、いただいた原稿で構成するときは、そのままCSMに入稿せず、チェックすると作業量の軽減につながると思います。

皆様の作業軽減の参考になれば幸いです。