banner

ニュース

Oct 17, 2023

GoogleスプレッドシートでHTMLタグを削除する方法

ウェブページから Google スプレッドシートにデータをコピーすると、不要な HTML コードが大量に含まれる可能性があります。 Google スプレッドシートで HTML タグを削除する方法は次のとおりです。

Google スプレッドシートは、データを整理して分析するための優れた方法です。 ただし、すべての優れたソフトウェアと同様に、ゴミが入ってくるとゴミが排出されます。 他のソースからデータを取得している場合は、予想以上のデータが得られる可能性があります。 必要な情報を誤ってインポートしてしまう可能性がありますが、無駄な HTML タグも大量にインポートしてしまう可能性があります。 これらのタグを削除するまでは、データに対して多くのことを行うことはできません。

ありがたいことに、これらの HTML タグをすべて削除して、必要な情報だけを残すことはそれほど難しくありません。 Google スプレッドシートで HTML タグを削除する方法は次のとおりです。

HTML タグは、これらのタグの内容を表示する方法を Web ブラウザーに指示する HyperText Markup Language (HTML) コードの一部です。 たとえば、HTML タグは、テキストのセクションを太字または斜体で表示するか、テキストを中央に揃えるか、コンテンツを埋め込むことができるフレームを作成するかをブラウザーに指示する場合があります。

これらの HTML タグは常に同じ形式になります。 これらは、

のように山かっこで囲まれたタグの名前で始まり、
のようにスラッシュが前に付いた同じタグで終わります。 抽出する情報はこれらのタグの間にあります。 たとえば、テキストを太字にするには、Hello World! を使用します。

Web ページからデータとコピーする値をコピーする場合、これらの HTML タグも誤ってコピーしてしまう可能性があります。 これらはスプレッドシートでは役に立たないため、削除して実際に必要な情報だけを残すことをお勧めします。

セルを調べ、その HTML タグをすべて削除して、残っているすべてを返す数式を作成できます。 元のセルはそのまま残りますが、新しいセルでは HTML タグがすべて削除され、必要なデータだけが残ります。 この数式を 1 つのセルに対して作成し、それを複数のセルにすぐに適用できます。

Google スプレッドシートの数式を使用して HTML タグを削除するには:

この式は、次を使用して機能します。正規表現置換関数。 この関数を使用すると、文字列の一部を別の文字列に置き換えることができます。 HTML タグを含むセルを選択して、置換するテキストを指定します。

次に、関数が検索する正規表現を指定します。 この場合、正規表現は次のようになります。

この式は、左山括弧で始まり、山括弧ではない文字を少なくとも 1 つ含み、閉じ山括弧で終わる文字列を検索します。 前に見たように、すべての HTML タグは山括弧で始まり山括弧で終わるため、この正規表現はこれらのタグのすべてのインスタンスを検索します。

式の最後の部分は、正規表現に一致するインスタンスを何も置き換えません。 HTML タグはすべて何も置き換えられないため、テキストだけが残ります。

この方法の欠点の 1 つは、データから HTML タグを削除しますが、データの新しい列を作成し、元のタグ付きデータもそのまま残ることです。 元のデータを削除すると、数式には何も作用しないため、新しく削除された値も消えます。

データをコピーして値として貼り付けることもできますが、これは理想的ではありません。 別の方法としては、検索と置換を使用してセルから HTML タグを取り除き、結果を同じセルに残すことです。

Google スプレッドシートの検索と置換を使用して HTML タグを削除するには:

Google スプレッドシートで HTML タグを削除する方法を学ぶと、不要なタグを削除するためにすべてのデータを手動で編集して何時間も無駄にする必要がなくなります。 上記のいずれかの方法を使用すると、タグをすぐに削除して、必要なデータだけを残すことができます。 ここで正規表現を使用できることは本当に救世主です。 大幅に時間を節約できるため、正規表現についてさらに学ぶ価値は間違いなくあります。

他にも、Google スプレッドシートに関する役立つヒントやテクニックがたくさんあります。 時間を追跡したい場合は、Google スプレッドシートでタイムスタンプを使用する方法を学ぶことができます。 数式で期待した結果が得られない場合は、Google スプレッドシートで数式を表示してエラーを確認する方法を学ぶことができます。 また、別のドキュメントのデータを利用したい場合は、Google スプレッドシートで別のシートにクエリを実行する方法を学ぶことができます。

あなたのメールアドレスが公開されることはありません。 必須フィールドは、マークされています *

コメント

名前 *

Eメール *

D

名前とメールアドレスを保存し、この投稿に新しいコメントが追加されたときにメールを送信してください。

Google スプレッドシートで数式を使用して HTML タグを削除するには: 「REGEXREPLACE」と入力します。 Google スプレッドシートで検索と置換を使用して HTML タグを削除するには: 編集 検索と置換 正規表現を使用した検索検索 すべてを置換
共有