管理 | 差分 || 新規作成 || カテゴリ一覧 | ページ一覧 | 更新履歴 | 差分履歴 || アンテナ || PUT || more≫ ≫omit
shortcut: FrontPage || WikiLab | StoreRoom/最新 | 日々の泡 | むず痒いパソコン日記/最新 || HelpPage ||[edit]
category: WebsiteWork/HtmlCss

WebsiteWork/HtmlCss/UseHtml - HTML文書を活用したい話。

LastModified : Tue Jun 17 11:23:27 2003
[管理]

HTML文書を活用したい話。

| むず痒いパソコン日記 | WebsiteWork | WebsiteWork/HtmlCss || category:HtmlCss |

HTML をもっと活用したい話。

[TOP↑] [管理]

不適切な HTML についての議論を読むたびに思うこと。 ブラウザが不適切な HTML を「制作者の意図どおり」に表示してしまうのがいけない。IE と NN で、「大体同じようなスタイルシート」なのがいけない。もし、NN4.x のテーブルみたいに、「閉じタグを忘れたら(ついでに入れ子が不正なら)、一切表示しない」という大胆さを持っていたら、それを無視する人はいないと思う。もし、<blockquote> が、IE ではインデント、NN では ボーダー囲いとかだったら、<blockquote> をインデント目的で使う人はだいぶ減る気がする。

なんて言ってみてもしょうがない。 もっと前向きに、「HTML を文法通りに書くと、こんないいことがあるよ」と言えたらいいのに。というわけで、私の欲しいブラウザの機能のお話。

テキストエディタの「アウトライン解析」。

[TOP↑] [管理]

使っているテキストエディタには、「アウトライン解析」という機能があって、デフォルトでいくつかのプログラム言語をアウトライン解析して別窓でツリー表示できるようになっている。但し、私には使う機会のない機能。

でも、自分で定義ファイルを作ることもできるので、例えば HTML の見出しタグを抜き出してツリー表示させることも出来る。長い文書を編集するときには任意の見出しまでジャンプできて、とても便利。ただ、定義ファイルの作り方がまずいのか、見出し以外のブロック要素も抜き出そうとすると理論構造が崩れて、例えばパラグラフの下階層に見出しが入ってしまったりする。見出しの下に、パラグラフや他のブロック要素が、構造を崩さずに収まるともっと便利なんだけど。段落の数を把握すると、見出しごとの文章の長さも大体把握できるだろうし。

ただし、これは汎用のテキストエディタなので、HTML専用のエディタならそんな機能がついているものもあるのかもしれない。でも、もしもあったとしても、その機能のために今使っている「お気に入り」のエディタから乗り換えるかというとそうでもないので、探す手間を惜しんだまま。

その後、HTML の解析が標準でつきました。とても便利。StoreRoom/2003/06

CSV と HTML。

[TOP↑] [管理]

CSV ファイルから必要なデータを切り出して HTML を生成する CGI (CGIRoom)を面白がっていたところで、カンマやタブでなく タグをデータの区切り とすれば、既存の HTMLファイルを CGI に渡して、「必要な部分だけ抜き出して表示」というようなことが出来るのに、と考え出した。

例えば、現在書いているパソコン日記。 あまりにも冗長なために第三者にとっては「資料的価値」があまりにも低い。どころか、自分でも読むのが面倒になる。 なんか、タグに「ここ要点」とか書いておけば、そこだけ抜き出して表示とか、出来ないの? コンピュータのクセに。

さらに、一応別ファイルに、簡単な内容を沿えてインデックスを作ってはいるんだけど、これを書くのが、かなりメンドクサイし、時々忘れる。yukiwiki の「見出しから自動的にインデックスをページの先頭に入れる」機能みたいに、インデックスが自動生成されればいいのに。

ブラウザ。

[TOP↑] [管理]

以前試用してみたタブブラウザには、ページ内のリンクを抜き出して表示するような機能があった記憶がある。見出しを抜き出して表示するブラウザがあるというような話も聞いて、それは便利だと思ったことがある。

どうせなら見出しだけでなく、専用のテキストボックスにタグを打ち込むと、そのタグに括られた部分、開始タグから終了タグまでを抜き出して表示するように出来ないんだろうか。例えば、[h1]で大見出しだけを抜き出し、[h?]で見出し全て、というように。 あるいは[blockquote]でページ内の引用部分だけ、とか。

さらに、属性値で検索して表示が出来るといい。例えばパソコン日記などに、<div class="software"> とか <div class="hardware"> とタグを付けておいて、[div;software]でソフトウェアに関する記述を抜き出して表示というように。

さらにさらに、属性値を区切り文字で複数記述できるといい。さらにさらに、もちろん and と or で検索できるといい。 [div;hardwere and trouble]みたいな感じで、ハードウェアのトラブルに関する記述だけを抜き出して表示とか。

HTML 制作者は、サイト内のどこかに「検索用の属性値一覧」を提示しておいて、閲覧者はブラウザの検索用テキストボックスに必要な情報と思われる属性値を入力して検索できる。とってもいい考えだと思ったんだけど、そういうブラウザってできないだろうか。

ついでに、なんか検索用キーワードのタグとかがあって、それを書いておくと、自動的にブラウザのドロップダウンメニューに表示されて、そこから選んで入力できるとかさ、なんとかならないの? コンピュータのクセに。

唐突な八つ当たりだけど、IE のページ内検索。一回毎に IME が OFF になるのって、ナントカならないの? せめて、IE 終了までは IME ON を覚えてくれててもいいじゃないの。

…考えれば考えるほど便利そうで、既にあるんじゃないかという気がしてきた。

2002-12-03 (tue) 23:00:00

CGI。

[TOP↑] [管理]

ブラウザを作るのはムリっぽいけど、もしかして、perl ならできるかも。 もちろん、「ブラウザを作る無理」さ加減が 100 として、「Perl で作る無理」さ加減が 96 とか、そんなもんだけど。

せっかく正確に HTML を記述しても、その報酬が lint で100点をもらえるだけでは甲斐がない。 「記述がラク」とか「メンテナンスがラク」とかじゃなく、「ラク」が「目に見える形」で表れないことには物足りない (と、私は思わないが、思う人が沢山いるのはとてもよく解る)。

厳格な規則性に則ってタグを記述したら、当然、厳格な規則性に則ってもうちょっと加工が出来たってよさそうなものじゃないの。

2002-12-21 (sat) 18:00:00

自分で出来ないけど、考えているようなことが「できるかどうか」だけでも知りたい。 CGI配布サイトを巡っていて、「オリジナルの CGI 制作承ります」なんて掲げているところを見つけ、思わず注文してみようかと思ってしまった。いくらぐらい掛かるんでしょうね。 掲示板は \40,000〜 とありましたけど、「〜」はクセもの。 私が考えているのがどの程度「めんどくさい代物」かも判らないし。

2002-12-24 (tue) 14:08:44

とかナントカ言ってるうちに、wiki。

[TOP↑] [管理]

WalWiki の検索に、新しい機能が追加された。

今までは、ページ名の一覧だけが表示されるという、一見さんにはあまり役に立たないものだった。 極端なことをいえば、どこかの「相談掲示板」では「件名:教えてください(または助けてください)」というスレッドが乱立する。誰でも自由にページを作成できる wiki でも、各人が必ずしも適切なページ名をつけるとは限らない。 ページを開いてがっかりしないように、もう少しページの内容を知る手がかりが欲しかった。

新しい機能では、キーワード文字列の含まれる見出しまでが表示される。 見出しの文字列が「内容の手がかりになる」以上に、ページを開いて、ブラウザの「ページ内検索」を使って目的の場所を探すという手間をかけて、挙句「がっかりする」ことがなくなる。

でも、私にとってもっと重要なことは、「複数のページから、必要な個所だけを抜き出せるようになる」ということだ。 例の、[ここ要点] と書いて、それを抜き出したいという悲願。

$line =~ s|\[key:([^\]]+?)\]|<a href="$url_cgi?mycmd=search&amp;mymsg=key:@{[&encode($1)]}">[$1]</a>|g;

もちろん、「複数のデータから、必要なものを抜き出す」という CGI は既に沢山あるから、今更そんなことで感動しなくてもいいようなものだけど、私が考えていたのは、既存のデータベース的な CGI よりはもっと自由な形、「必要な入力項目」があらかじめ複数決められていたり、それらが常に「決まった形」で表示されたりするのではなく、任意の形式で書いた中から、必要なものだけを手繰り寄せるという方法。

それに、なんと言っても、一つの文書内だけでは、物足りないもの(1ページがやたら長くなりがちな私以外には、上に書いたブラウザの機能は、あんまり有効でないかもね)。

やっぱり、あなどれない wiki。

っていうか、しまった。
HTML の話じゃなくなっちゃった。

hns にも、見出しごとにキーワードを設定する機能があるみたい。 実際、wiki よりも日記用の CGI のほうが私のやりたいことに適してるかもしれないと思ったこともあるけど、今現在の状況を見るに、「日付ごと」の管理ではやっぱり間に合わない。 「ページごと」、ページ内は何をやろうが全くの自由というのが、「記録の山」には合ってる気がする。
関連:ゆるゆるのページ管理が好きらしい考察

2003/01/28(Tue) 19:56:52


いや、HTML の話でいいんじゃないの? CGI で、「このディレクトリ以下の HTML ファイルから、ナントカの要素を抜き出して表示」ってできればいいわけでしょ。

2003/04/05(Sat) 20:46:13

これ、本当に出来ないかな。どこからか普通の検索用 CGI をもらってきて、タグ検索機能付き、みたいになんとかかんとか…。むりかなぁ。wiki の検索をいじろうとして全然わからなかったしなぁ。

2003/04/10(Thu) 22:33:48

そのうち取り組む はず の課題。

[TOP↑] [管理]

前に使っていた検索用のCGI。 これでもタグを検索することは出来るわけで。 「検索結果ヒントの表示行数」というのを、「閉じタグまで」とするだけで、大分イメージに近いわけで。 設定用のファイルに、検索に使用するタグと属性値を指定できるようにして、ドロップダウンで選ばせる形にすればいいわけで。

で、それはどうすればいいんでしょうね。

あ、でもこれって、同じファイルに複数キーワードが含まれてても、最初の一つしか表示しないんだった。 結構探したんだけど、お手軽そうなのでヒット個所を全部表示するようなのって見つけられなかったんだった。

で、ヒット個所全部表示させるには、どうしたらいいんでしょうね。

2003/04/10(Thu) 23:13:35

めも。

[TOP↑] [管理]
shortcut: FrontPage || WikiLab | StoreRoom/最新 | 日々の泡 | むず痒いパソコン日記/最新 || HelpPage || [edit]
select css: default | sakura | mono | greenheck | snow | NN4.x用(多分) || LinuZau!! | VikiWiki!? || others |

管理 | 差分 || 新規作成 || カテゴリ一覧 | ページ一覧 | 更新履歴 | 差分履歴 || PUT