Հորիզոնական Boxplots կետերով, օգտագործելով Seaborn Python-ում


Boxplots-ը տվյալների հավաքածուների տվյալների վիզուալիզացիայի համար հասանելի ամենահայտնի գործիքներից է, որը հիմնականում ստեղծվում է Seaborn կոչվող python գրադարանի միջոցով, որն ապահովում է ինչպես հորիզոնական, այնպես էլ ուղղահայաց տուփերի և այլ տեսակի վիզուալիզացիաներ ստեղծելու պարզ և հզոր միջոց:

Այս հոդվածում մենք կկենտրոնանանք այն բանի վրա, թե ինչպես կարելի է ստեղծել հորիզոնական տուփի սխեման՝ օգտագործելով Seaborn Python-ում:

Ինչ է տուփի հողամասը:

Նախ, եկեք սահմանենք, թե ինչ է տուփը: Boxplot-ը տվյալների շտեմարանի գրաֆիկական ներկայացումն է, որը փոխանցում է տվյալների բաշխումը տվյալների շտեմարանում՝ օգտագործելով outliers, quartiles և median: Գծապատկերի մեջտեղում գտնվող վանդակը ներկայացնում է տվյալների միջքառորդական միջակայքը (IQR), որի բեղերը տարածվում են նվազագույն և առավելագույն արժեքների վրա, որոնք ընկնում են միջինից որոշակի հեռավորության վրա: Outliers-ը ներկայացված են որպես առանձին կետեր բեղերից դուրս:

Հորիզոնական տուփեր՝ Seaborn-ի օգտագործմամբ կետերով

Եկեք սկսենք նրանից, թե ինչպես կարող ենք ստեղծել հորիզոնական տուփի սխեման կետերով՝ օգտագործելով Seaborn Python-ում: Մենք կօգտագործենք «խորհուրդներ» կոչվող «Սիբորնի» գրադարանի տվյալների բազան, որը պարունակում է տեղեկատվություն, որը պարունակում է սյունակների ընդհանուր հաշվարկի գումարը և շաբաթվա օրը ռեստորանում:

Ստորև բերված են այն քայլերը, որոնք մենք կհետևենք՝ Python-ում Seaborn-ի միջոցով կետերով հորիզոնական տուփի գծապատկեր ստեղծելու համար.

  • Ներմուծեք բոլոր անհրաժեշտ գրադարանները, ինչպիսիք են seaborn-ը և matplotlib-ը:

  • բեռնել «tips» հավաքածուն՝ օգտագործելով sns.load_dataset() ֆունկցիան −

  • Այնուհետև մենք կարող ենք ստեղծել հորիզոնական արկղ՝ օգտագործելով sns.boxplot() ֆունկցիան:

  • Մենք x և y փոփոխականները դնում ենք համապատասխանաբար «total_bill» և «day»՝ գծապատկերի ընդհանուր գումարը x առանցքի վրա, իսկ շաբաթվա օրը y առանցքի վրա:

  • Մենք նաև whis պարամետրը դրեցինք [0, 100]՝ տվյալների ամբողջ տիրույթը ցույց տալու համար, և կարգավորեցինք տուփերի լայնությունը և ծայրամասերի չափը՝ օգտագործելով լայնության և թռուցիկների չափի պարամետրերը:

  • Վերջապես, մենք դրեցինք orient պարամետրը «h»՝ հորիզոնական տուփի գծապատկեր ստեղծելու համար:

  • Հաջորդը, մենք կարող ենք անհատական տվյալների կետեր ավելացնել սյուժեին՝ օգտագործելով sns.swarmplot() ֆունկցիան:

  • Մենք կրկին x և y փոփոխականները դնում ենք «total_bill» և «day» և կարգավորում ենք կետերի չափն ու գույնը՝ օգտագործելով չափի և գույնի պարամետրերը:

  • Մենք նաև դրել ենք orient պարամետրը «h»՝ հորիզոնական երևույթ ստեղծելու համար:

  • Վերջապես, մենք ավելացնում ենք վերնագիր և առանցքի պիտակներ սյուժեին՝ օգտագործելով ստանդարտ Matplotlib ֆունկցիաները plt.title(), plt.xlabel() և plt.ylabel():

  • Այնուհետև մենք կարող ենք ցույց տալ սյուժեն՝ օգտագործելով plt.show() ֆունկցիան

Օրինակ

import seaborn as snsb
import matplotlib.pyplot as pltt

# Load example dataset
tips_df = snsb.load_dataset("tips")

# Create horizontal boxplot with points
snsb.boxplot(x="total_bill", y="day", data=tips_df, whis=[0, 100], width=.6, fliersize=5, orient="h")
snsb.swarmplot(x="total_bill", y="day", data=tips_df, color=".2", size=3, orient="h")

# Add title and axis labels
pltt.title("Total Bill by Day")
pltt.xlabel("Total Bill ($)")
pltt.ylabel("Day of Week")

# Show plot
pltt.show()

Արդյունք

Ծրագիր հարմարեցված հորիզոնական տուփի համար

import seaborn as snss
import matplotlib.pyplot as pltt

# Load example dataset
tips_df = snss.load_dataset("tips")

# Set style and color palette
snss.set_style("whitegrid")
snss.set_palette("husl")

# Create horizontal boxplot with points
snss.boxplot(x="total_bill", y="day", data=tips_df, whis=[0, 100], width=.6, fliersize=5, orient="h")
snss.swarmplot(x="total_bill", y="day", data=tips_df, color="black", size=4, orient="h")

# Customize plot appearance
pltt.title("Total Bill by Day", fontsize=14, fontweight="bold")
pltt.xlabel("Total Bill ($)", fontsize=12)
pltt.ylabel("Day of Week", fontsize=12)
pltt.xticks(fontsize=10)
pltt.yticks(fontsize=10)

# Adjust plot dimensions
pltt.figure(figsize=(8, 6))

# Show plot
pltt.show()

Արդյունք

  • Վերոնշյալ հարմարեցված ծրագրում մենք սկսում ենք ներմուծել անհրաժեշտ գրադարանները, ներառյալ Seaborn-ը և Matplotlib-ը:

  • Բեռնեք «tips» կոչվող տվյալների հավաքածուն՝ օգտագործելով sns.load_dataset() գործառույթը Seaborn-ից:

  • Անհատականացրեք սյուժեի տեսքը՝ ոճը դնելով «whitegrid»՝ օգտագործելով sns.set_style(): Բացի այդ, մենք գունային գունապնակը դրեցինք «husl»՝ օգտագործելով sns.set_palette():

  • Ստեղծեք հորիզոնական տուփի սխեման՝ օգտագործելով sns.boxplot()՝ նշելով x և y փոփոխականները համապատասխանաբար որպես «total_bill» և «day»:

  • Մենք հարմարեցնում ենք տարբեր պարամետրեր, ինչպիսիք են՝ whis-ը, լայնությունը և թռուցիկի չափը՝ տուփի տեսքը հարմարեցնելու համար:

  • Անհատական տվյալների կետեր ավելացնելու համար մենք օգտագործում ենք sns.swarmplot() և հարմարեցնում ենք դրա գույնը, չափը և կողմնորոշումը:

  • Սյուժեի տեսքը հետագայում հարմարեցնելու համար մենք փոփոխում ենք վերնագիրը, xlabel-ը և ylabel-ը՝ օգտագործելով Matplotlib-ից plt.title(), plt.xlabel() և plt.ylabel() ֆունկցիաները:

  • Մենք նաև կարգավորում ենք վերնագրի, պիտակների և տառերի տառաչափերը՝ օգտագործելով տառաչափը:

  • Բացի այդ, մենք կարող ենք կարգավորել գծապատկերի չափերը՝ նշելով նկարի չափը՝ օգտագործելով plt.figure() և ցանկալի չափերը փոխանցելով որպես բազմակի:

  • Վերջապես, մենք օգտագործում ենք plt.show()՝ ցուցադրելու հարմարեցված հորիզոնական արկղը կետերով:

Եզրակացություն

Եզրափակելով, Python-ում Seaborn-ի օգտագործմամբ հորիզոնական արկղերի ստեղծումը կարևոր տեխնիկա է տվյալների հավաքածուների վիզուալացման, տվյալների բաշխման և տարբեր փոփոխականների միջև փոխհարաբերությունները ուսումնասիրելու համար: Մենք օգտագործել ենք ծովածոցների boxplot() և swarmplot() ֆունկցիաները՝ ստեղծելու տեսողական գրավիչ հորիզոնական տուփեր, որոնք պատկերում են հիմնական վիճակագրական չափորոշիչները, ինչպիսիք են մեդիանները, ծայրամասերը և քառորդները: