ここでは「BeautifulSoup」を用いたスクレイピングの解析の際、理解するのに最低限押さえておきたいCSSセレクタの書式を一覧でまとめています。
CSSセレクタの書式一覧
基本書式
項目 | 内容 |
* | 全ての要素 |
要素名 | 要素名で指定した要素 |
.クラス名 | クラス名をつけた要素 |
#id名 | id属性をつけた要素 |
セレクタの関係式
項目 | 内容 |
セレクタ,セレクタ | 列挙された複数のセレクタ ex)h1,h2,h3 |
セレクタ セレクタ | 下の階層の子孫要素 ex)div h1 |
セレクタ>セレクタ | 直下の階層の子要素 ex)div>h1 |
セレクタ+セレクタ | 同じ階層で直後に隣接している要素 ex)h1+h2 |
セレクタ*~セレクタ* | セレクタ*~セレクタ*までの要素 ex)*~* |
セレクタ属性の関係式
項目 | 内容 |
要素[att] | 特定の属性名を持つ要素 |
要素[att=”***”] | att属性に***という値を持つ要素 |
要素[att~=”***”] | att属性の値候補***に一致した要素 |
要素[att | =”***”] | att属性の値が***で始まる要素 |
要素[att ^=”***”] | att属性の値が***で始まる要素 |
要素[att $=”***”] | att属性の値が***で終わる要素 |
要素[att*=”***”] | att属性の値に***を含む要素 |
位置や状態の書式
項目 | 内容 |
要素:root | ルートとなる要素 |
要素:nth-child(n) | n番目の子となる要素 |
要素:nth-last-child(n) | 後ろからn番目となる要素 |
要素:nth-of-type(n) | n番目のその種類の要素 |
要素:first-child | 子として最初の要素 |
要素:last-child | 子として最後の要素 |
要素:first-of-type | 最初のその種類の要素 |
要素:last-of-type | 最後のその種類の要素 |
要素:only-child | 子として唯一の要素 |
要素:only-of-type | 子として唯一の種類の要素 |
要素:empty | 要素内容が空となる要素 |
要素:lang(code) | 特定の言語にcodeを指定された要素 |
要素:not(a) | a以外の要素 |
要素:enabled | 有効となっているUI要素 |
要素:disabled | 無効となっているUI要素 |
要素:checked | チェックされているUI要素 |