Ինչպե՞ս վերցնել DataFrame-ի սյունակ-կտորներ պանդաներում:


Pandas-ը` Python-ի ազդեցիկ գրադարանը, որը հայտնի է իր տվյալների մանիպուլյացիայի և վերլուծության հնարավորություններով, առաջարկում է մի շարք գործիքներ տվյալների հզորացման համար: ինչպես գիտնականները, այնպես էլ վերլուծաբանները: Տվյալների հիմնական կառուցվածքների շարքում DataFrame-ն առանձնանում է երկչափ պիտակավորված տվյալների կառուցվածքով՝ պոտենցիալ տարբեր տեսակների սյունակներով: DataFrames-ի հսկայական լանդշաֆտը անցնելիս հաճախ անհրաժեշտ է դառնում հանել կոնկրետ սյունակներ կամ սյունակների մի շարք, որը սովորաբար կոչվում է սյունակ կտրատում: Այս հոդվածում մենք սկսում ենք ճանապարհորդություն՝ ուսումնասիրելու տարբեր մեթոդներ, որոնք բացահայտում են պանդաներում սյունակ կտորներ վերցնելու գաղտնիքները: Պատրաստվեք արշավախմբի համար հետևյալ մեթոդների միջոցով, որոնք կհեղափոխեն ձեր տվյալների մանիպուլյացիայի հմտությունները՝

  • Բացահայտելով սյունակների պիտակների կախարդանքը

  • Վառ «iloc» սեփականությունը. սանձազերծելով ինդեքսների ուժը

  • «loc» հատկությունը. Ընտրովի կտրատման դարպաս

  • Կոդի ջարդում հզոր «ֆիլտր()» ֆունկցիայով

Օրինակ 1. Սյունակների պիտակների մոգության բացահայտում

DataFrame-ից որոշակի սյունակներ ընտրելիս անցնելու ամենապարզ ճանապարհը ներառում է սյուների կախարդական պիտակների օգտագործումը: Դուք կարող եք օգտագործել «[]» քառակուսի փակագծերի ուժը և օգտագործել սյունակի պիտակը միայնակ սյունակ ընտրելու համար կամ նրբագեղ կերպով փոխանցել սյունակների պիտակների ցանկը՝ ընդգրկելու բազմաթիվ սյունակների շքեղությունը:

import pandas as pd

data = {'A': [1, 2, 3],
        'B': [4, 5, 6],
        'C': [7, 8, 9]}

df = pd.DataFrame(data)

# Initiating the mystical selection of a single column
col_A = df['A']
print(col_A)

# Embracing the enchantment of multiple columns
cols_AB = df[['A', 'B']]
print(cols_AB)

Արդյունք

0    1
1    2
2    3
Name: A, dtype: int64

   A  B
0  1  4
1  2  5
2  3  6

Օրինակ 2. Վառավոր «iloc» սեփականություն. սանձազերծելով ինդեքսների ուժը

Ահա «iloc» հատկության վեհությունը, մի ուժ, որի հետ պետք է հաշվի առնել, երբ խոսքը գնում է ամբողջ թվերի ինդեքսների հսկայական հզորության միջոցով սյունակներ ընտրելիս: Այն փայլում է ամենապայծառ, երբ ձգտում եք անցնել սյուների տիրույթ կամ երբ խուսափողական սյունակների պիտակները խուսափում են ձեր գիտելիքներից:

import pandas as pd

data = {'A': [1, 2, 3],
        'B': [4, 5, 6],
        'C': [7, 8, 9]}

df = pd.DataFrame(data)

# Initiating the magnificent selection of a single column
col_A = df.iloc[:, 0]
print(col_A)

# Embracing the grandiose power of multiple columns
cols_AB = df.iloc[:, 0:2]
print(cols_AB)

Արդյունք

0    1
1    2
2    3
Name: A, dtype: int64

   A  B
0  1  4
1  2  5
2  3  6

Օրինակ 3. «loc» հատկությունը. Ընտրովի կտրման դարպաս

Բարի գալուստ «loc» հատկության տիրույթ, որը հարգված մեթոդ է սյունակներն ընտրելու իրենց պիտակների հիման վրա: Արձագանքելով առաջին մեթոդի հետ՝ այն ձեզ հնարավորություն է տալիս ճանապարհորդել մի շարք սյունակների միջով՝ օգտագործելով հարգված երկու կետ «:» օպերատորը:

import pandas as pd

data = {'A': [1, 2, 3],
        'B': [4, 5, 6],
        'C': [7, 8, 9]}

df = pd.DataFrame(data)

# Initiating the wondrous selection of a single column
col_A = df.loc[:, 'A']
print(col_A)

# Embracing the majesty of multiple columns
cols_AB = df.loc[:, 'A':'B']
print(cols_AB)

Արդյունք

0    1
1    2
2    3
Name: A, dtype: int64

   A  B
0  1  4
1  2  5
2  3  6

Օրինակ 4. Կոդի կոտրում Mighty «ֆիլտր()» ֆունկցիայի միջոցով

Պատրաստվեք բացահայտելու «ֆիլտր()» ֆունկցիայի գաղտնիքները՝ արտասովոր գործիք, որը ձեզ հնարավորություն է տալիս կանոնավոր արտահայտություններով սյունակներ ընտրել: Նրա իսկական ուժը դրսևորվում է, երբ փնտրում եք սյունակներ, որոնք իրենց պիտակների մեջ կրում են որոշակի օրինաչափության նշան:

import pandas as pd

data = {'A': [1, 2, 3],
        'B': [4, 5, 6],
        'C': [7, 8, 9]}

df = pd.DataFrame(data)

# Selecting columns blessed with labels commencing with 'A' or 'B'
cols_AB = df.filter(regex='^(A|B)')
print(cols_AB)

Արդյունք

   A  B
0  1  4
1  2  5
2  3  6

Եզրակացություն

Այս ակնածանք ներշնչող արշավախմբի ընթացքում մենք անցել ենք տարբեր մեթոդներ, որոնք հնարավորություն են տալիս Pandas DataFrames-ից սյունակների կտորներ հանել: Մենք նրբորեն նավարկեցինք սյունակների պիտակների տիրույթում, խորացանք նշանավոր «iloc» և «loc» հատկությունների տիրույթներում և վերջապես կոտրեցինք կոդը հզոր «filter()» ֆունկցիայի միջոցով: Յուրաքանչյուր տեխնիկա պարծենում է իր եզակի առավելություններով և հարմարեցված է հատուկ օգտագործման դեպքերին անդրադառնալու համար: Զինված այս խորը պատկերացումներով՝ դուք այժմ պատրաստ եք հմտորեն մանևրելու DataFrame սյունակի խճճված ցանցով, որը կտրատում է պանդաներում՝ հաղթահարելով ձեր առջեւ ծառացած տվյալների վերլուծության ցանկացած առաջադրանք: Սանձազերծեք ուժը ներսից և թույլ տվեք, որ ձեր տվյալների հետախուզման և մանիպուլյացիայի հմտությունները հասնեն նոր բարձունքների»: