忍者ブログ
管理人がどうやってオンライン小説サイトを作っていったのか、その実体験によるノウハウや悪戦苦闘の日々をつづるWEB小説制作日記ブログです。 ちょっと変わった独自システム付きのネット小説サイトを運営しています。
[96]  [95]  [94]  [93]  [92]  [91]  [90]  [89]  [88]  [87]  [86
×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

小説投稿サイトツギクル」さんには、他サイトに無い独自機能として「AI分析」というものがあるのですが…
 
(その小説が任意のジャンルに対してどの程度「適性」があるか診断してくれるサービスです。内部投稿(もしくは小説家になろう投稿)かつ一定以上の文字数が必要など、条件はありますが、無料で診断してくれます。分析すると、数値(適性値)は必ず作品情報にくっついてしまうようですが、分析レポートは(他のユーザーに)開示するかどうか選べます。)
 
「ファンタジー」「恋愛」と2つある分析機能のうち、「ファンタジー」の方を試してみましたので、そのAI分析について独自に「分析」してみます。
 
ツギクルさんのAIがどういうシステムで運用されているかは分かりませんので、以下はあくまで自作品の分析レポートを読んだ上での個人的見解(予想)です。
 
実際のシステムとは異なる可能性もありますので、予めご了承ください。
 
また、AIディープラーニングは、まだ進化の途中――“発展途上”の技術です。
 
AIの方が人間より優れている部分もあれば、AIには(まだ)できない部分もあります。
 
ですので、AIの出した分析を絶対視することなく、かと言って軽視するでもなく、「その分析がどのように出されているのか・“何を”分析しているのか」を考えた上で、使える部分は利用し、「ちょっと違うな…」という部分はスルーして、上手く役立ていくのがべストなやり方かと思っています。
 
今の時代、AI分析に限らず、「その数字が何によって出されているのか・何を表しているのか」を考えることもないまま、ただ「数字に踊らされている」人間が結構いらっしゃるように見受けられますので…。
 
(ちなみに、自分は分析レポートを開示していますので、合わせて見ていただけると、より分かりやすいかも知れません。)
 
<関連リンク:英雄群像ファンタジカ作品情報ページ(ツギクル)>
 
(分析レポートは「AI分析レポート」というボタンから見られます。←PC版ではタイトルの上、スマホ版だと小説概要の下お知らせの上あたりにあります。)
 
ゴリゴリのファンタジー用語でないと他ジャンルにカウントされる可能性あり?
実は実際に分析する前、自分は「この分析って、たぶんコレをこうして数値化するんだろうなー…」というのを予測していました。
 
それはズバリ「小説の本文の中から単語(名詞)をピックアップし、その単語がどのジャンルに属するのか(ファンタジーに属する単語なのかどうか)を蓄積したデータと比較検討し、そのパーセンテージでもって数値を弾き出すのだろう」ということだったのですが…
 
(ただ、小説の紹介文からの「重要キーワード」の抜き出し方を見ていて、ちょっと不安を覚えたりはしていましたが…。「『そこまで』で1つの単語として見ちゃうの!?」みたいな抜き出し方が多かったので…。)
 
実際に出て来た分析結果を見て…「(たぶん)だいたい合ってたけど、予想外の部分も結構あったな…」と思いました。
 
具体的に何が「予想外」だったかと言うと「ジャンルの判断力」です。
 
どうもファンタジージャンルにカウントされるのは「勇者」だとか「聖女」だとか「ファンタジー以外には絶対に使われない」と思しき単語ばかりで、それ以外はたとえファンタジーな単語であっても別ジャンルと判断される可能性が高いようです。
 
たとえば、自分の作品の場合「歴史・時代」に振り分けられた割合が高いのですが…
 
おそらくは「王国」「王女」「騎士団」等々のあたりの、「ファンタジーでも使われるけど、歴史物語でも使われそうな単語」が「歴史・時代」のジャンルに振り分けられたのではないかと…(あくまで予想ですが)
 
個人的には「設定が中世ヨーロッパ的でも、実際の歴史を元にしたものでない“架空の”国が舞台なら、それはファンタジー」という考えなのですが、さすがに「舞台が架空の国(世界)か、現実の歴史を下敷きにしたものか」の判断はAIではしてくれないようです。
 
つまりは、同じファンタジージャンルであっても、歴史用語を多用した本格的なハイファンタジーや戦記ファンタジーは、ファンタジーai値の低い、「歴史・時代」寄りな作品と判断される傾向にあるのではないかと…。

「ファンタジー以外のジャンル」には、他に「青春」「恋愛」「SF」等がありましたので、人間ドラマに重点を置いて「青春」「恋愛」等の割合が高くなった場合にも、やはりファンタジーai値は下がるのではないかと予測されます。
 
自分の作品の分析レポートで、一点ちょっとよく分からないのが、「SFジャンル」の割合の高さなのですが…
 
…SFの要素、全くと言って良いほど入っていないので…。
 
「ターニング・ポイント」や「原因」「理由」などの論述的な単語がSFとしてカウントされたのか、それとも文章の構造などを見られていて、ロジカルな構成がSF的と捉えられたのか…
 
あるいは、少しでも科学的な単語は、全てSFジャンルに振り分けられるのかも知れませんが…これは、もう少しデータを集めてみないことには分かりません。
 
地の文と台詞のバランスは「話し言葉」の出現率で見ている?
AI分析の結果には「地の文とセリフの割合」というものもありました。
 
自分の場合、「地の文1:9セリフ」と分析されたのですが…
 
(数字の見た目は「地の文9:1セリフ」となっているのですが、コメントが「セリフが多いかな」なことからして、「地の文1:9セリフ」という判断なのではないかと…。)
 
…残念ながら実際は真逆です(台詞は、ほとんどありません)。
 
台詞量を見るなら、単純に「 」の中の文字数をカウントすれば良いのではないかと思ってしまうのですが、どうやらそういう分析方法ではないようです。
 
…となると、おそらくは「話し言葉」の出現頻度でもって判断しているのではないか、という予測になるわけですが…
 
そうなると、ラノベによくある「超口語体な一人称」は、たとえ地の文であっても全て台詞としてカウントされることになってしまう気がします。
 
(実際、自分の作品も口語体の一人称です。)
 
なので、実際にはこの部分は「地の文とセリフの割合」というより「説明的文章と話し言葉の割合」として見ると良いのではないかと思われます。
 
AIの想定していないテクニックは考慮されない
AI分析では「文章の読みやすさ」を各部の文字数や、名詞・動詞等の出現率で判断しているようです。
 
分析レポートには、「一文の平均文長」「平均句読点間隔」「改行までの文字数」「名詞の出現率」「動詞の出現率」「接続詞の出現率」「受動態の出現率」等々がカウントされているのですが…
 
これを見て思ったのは、「読みやすさが単純に文字数でのカウントなら、文章のまとまりをカギカッコでくくったり、文章の並びを工夫して読みやすくしている等々のテクニックは考慮されないのだろうか?」ということでした。
 
「小説の読みやすさ」とは、単純に文字の量が多いか少ないかだけではありません。
 
起承転結やメリハリがあるか、過不足なく説明できているか等々も大事な「読みやすさ」です。
 
複数通りの読み方がある漢字にルビを振って読み間違えないようにしたり、ひらがなばかりがながくつづいてしまうとよみづらいので(←この部分わざと平仮名ばかりにしています)、適度に漢字を入れたり、カタカナに変えられるところは変えたりするのも、読みやすさの工夫です。
 
しかし、さすがにそこまでを分析する技術は現在のAIには無いのかも知れません。
 
そして、「名詞や動詞の出現率」などで読みやすさを判断されてしまうとしたら…たとえば「そら、あお、とり、きれい」など、抽象的で詩的な感じの特殊な文章だと、「読みにくい」という判断にされてしまうのだろうか…という疑問もあります。
 
まぁ、そもそもAIのディープラーニングとは「既にあるものを学習する」ことで獲得できる知能ですので、「滅多にない」「レア」で「特殊」なテクニックを想定することは難しいかと…。
 
何はともあれ、「小説の」読みやすさというより「文章の」読みやすさという観点で見るなら、それなりに使える分析レポートなのではないかと思われます。
 
(一文の長さや文字数間隔については、個々の好みもあるとは思いますが…。)
 
それと、ここでのポイントは、あくまで「読みやすさ」であって「分かりやすさ」とはどこにも書かれていない点ですね。
 
(「読みやすさ」ではなく「分かりやすさ」「理解のしやすさ」をAIに判定させるのは、まだ相当に難しいことだと思われますので…。)
 
総評はどうやって出しているのか…?
今回の分析レポートで、どうしても「どうやって出しているのか分からない」となった部分が一点あります。
 
それは作品総評下部の「楽しい仕掛け」がたっぷりあって「大満足」だったという部分です。
 
まず「大満足」は誰にでも(全員に)付けられる評価なのか、それとも作品によってコメントが変わってくるのか、比較対象がないことには分かりません。
 
それと「楽しい仕掛け」は、何でどうやって判断したのか…
 
分析依頼をした人のほとんどに付けられるリップサービス的なコメントなのか、叙述トリックやサプライズを判断する能力があるのか(だとしたらスゴ過ぎるのですが)…
 
それとも総評のコメントは全部が全部AIではなく、実は人間が付けている部分もあるのか…
 
そこの部分については、もっとデータを集めたり、他の分析レポートと比較してみないことには、ちょっとどうしても分析できません…。
 
(ちなみに自分の作品、「仕掛け」とまで言えるのかどうかは分かりませんが、第4章(第4話)にあたる部分が主人公(語り手)の性別をハッキリさせていませんので、男女どちらで考えても読めるという構造にはなっています。あと、章(話)ごとに視点が切り替わっていますので、合わせて読み進めていくと、前の章(話)では分からなかったキャラの心情が分かるようになる、といった工夫はあります。)
 
何はともあれ「どうやって分析しているんだろう」と考えながら分析レポートを読むのは、それなりに楽しかったので、いずれは「恋愛」の方でもやってみたいなと思っています。
 
(ただし、そのためには新しく恋愛小説を書かなければいけないのですが…。←相変わらず他サイトと重複投稿しようという気がない。)

拍手[0回]

PR
ブログ内検索
ブログ更新&チェックについて。

このブログは管理人に時間の余裕がある時にちょこっとずつ更新していく予定ですので、更新やチェックの頻度はおそらく数週間に1回~下手をすると1ヶ月以上の間が空いてしまう可能性も…。
もし更新が滞ったり、コメントくださって返事がなくても「あぁ、仕事が忙し過ぎて時間が無いんだな」と気長にお待ちいただければ幸いです。

ブログもくじ
ブログ記事一覧

(サイトと連動して作ったこのブログのもくじです。手動更新のため、最新記事などは入っていない可能性が高いです。)
管理人プロフィール
HN(ハンドル・ネーム):
津籠睦月(つごもりむつき)
職業:
社会人(毎日PCを使う仕事。残業も休日出勤も普通にあります。)
趣味:
小説・HP制作、読書、猫と遊ぶこと。
好きな小説ジャンル:
ファンタジー、冒険、恋愛、青春、推理、濃い人間ドラマの展開するモノ。
備考:
漢検2級(準1以上は未受験)。国語の最高偏差値80(高2時点)。

オリジナルのWEB小説サイトを運営しています。
猫好きです。
HPにも小説内にも気づけばあちこちに猫が…。
各種WEBサービス公式リスト
↑ 下部のURL( twitter.com/i/… )をクリック(タップ)でリストが表示されます。
webサービス不具合情報
参加ポータルサイト

人気ブログランキング
参加しているポータルサイト(ランキング)です。
相互RSS
アクセス・カウンター
小説サイト「言ノ葉ノ森」関連Tweetまとめ
P R
忍者ブログ [PR]