In [2]:
# df1 sahpe 구하기
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
#파일
url= 'https://ds-lecture-data.s3.ap-northeast-2.amazonaws.com/stocks/Travel.xlsx'
# 데이터 프레임으로 불러오기
df1= pd.read_excel(url, sheet_name=0)
df2= pd.read_excel(url, sheet_name=1)
In [3]:
df1.head()
Out[3]:
주요재무정보 | 2019/09\n(IFRS연결) | 2019/12\n(IFRS연결) | 2020/03\n(IFRS연결) | 2020/06\n(IFRS연결) | 2020/09\n(IFRS연결) | 2020/12(E)\n(IFRS연결) | 2021/03(E)\n(IFRS연결) | 2021/06(E)\n(IFRS연결) | |
---|---|---|---|---|---|---|---|---|---|
0 | 매출액 | 14753.0 | 15440.0 | 9437.0 | 5230.0 | 8795.0 | 9980.0 | 9761.0 | 9820.0 |
1 | 영업이익 | 574.0 | 776.0 | -668.0 | -634.0 | -198.0 | 50.0 | 144.0 | 265.0 |
2 | 영업이익(발표기준) | 574.0 | 776.0 | -668.0 | -634.0 | -198.0 | NaN | NaN | NaN |
3 | 세전계속사업이익 | 376.0 | 538.0 | -925.0 | -819.0 | -366.0 | -109.0 | 14.0 | 172.0 |
4 | 당기순이익 | 274.0 | 380.0 | -736.0 | -677.0 | -285.0 | -100.0 | 71.0 | 214.0 |
In [4]:
df2.head()
Out[4]:
주요재무정보 | 2019/09\n(IFRS연결) | 2019/12\n(IFRS연결) | 2020/03\n(IFRS연결) | 2020/06\n(IFRS연결) | 2020/09\n(IFRS연결) | 2020/12(E)\n(IFRS연결) | 2021/03(E)\n(IFRS연결) | 2021/06(E)\n(IFRS연결) | |
---|---|---|---|---|---|---|---|---|---|
0 | 매출액 | 4055.0 | 3728.0 | 2360.0 | 346.0 | 766.0 | 1581.0 | 1473.0 | 1746.0 |
1 | 영업이익 | 1392.0 | 641.0 | -1868.0 | -1038.0 | -649.0 | -434.0 | -187.0 | -65.0 |
2 | 영업이익(발표기준) | 1392.0 | 641.0 | -1868.0 | -1038.0 | -649.0 | NaN | NaN | NaN |
3 | 세전계속사업이익 | 1554.0 | 769.0 | -2204.0 | -723.0 | -552.0 | -331.0 | NaN | NaN |
4 | 당기순이익 | 1286.0 | 526.0 | -1561.0 | -456.0 | -409.0 | -465.0 | NaN | NaN |
In [5]:
# 행과 열을 바꾼다
df1=df1.T
df2=df2.T
In [6]:
df1.head()
Out[6]:
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | ... | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
주요재무정보 | 매출액 | 영업이익 | 영업이익(발표기준) | 세전계속사업이익 | 당기순이익 | 당기순이익(지배) | 당기순이익(비지배) | 자산총계 | 부채총계 | 자본총계 | ... | ROA(%) | 부채비율 | 자본유보율 | EPS(원) | PER(배) | BPS(원) | PBR(배) | 현금DPS(원) | 현금배당수익률 | 현금배당성향(%) |
2019/09\n(IFRS연결) | 14753.0 | 574.0 | 574.0 | 376.0 | 274.0 | 277.0 | -3.0 | 37747.0 | 28854.0 | 8893.0 | ... | 3.62 | 324.45 | 395.1 | 692.0 | 31.19 | 23484.0 | 3.67 | 0.0 | NaN | 0.0 |
2019/12\n(IFRS연결) | 15440.0 | 776.0 | 776.0 | 538.0 | 380.0 | 380.0 | 0.0 | 35273.0 | 26077.0 | 9195.0 | ... | 5.81 | 283.59 | 411.78 | 950.0 | 21.4 | 24282.0 | 3.74 | 350.0 | NaN | 34.94 |
2020/03\n(IFRS연결) | 9437.0 | -668.0 | -668.0 | -925.0 | -736.0 | -736.0 | 0.0 | 33188.0 | 24813.0 | 8375.0 | ... | 1.25 | 296.28 | 368.36 | -1839.0 | 63.76 | 22114.0 | 3.19 | NaN | NaN | 0.0 |
2020/06\n(IFRS연결) | 5230.0 | -634.0 | -634.0 | -819.0 | -677.0 | -678.0 | 1.0 | 33039.0 | 25364.0 | 7676.0 | ... | -2.14 | 330.45 | 334.46 | -1695.0 | NaN | 20265.0 | 3.5 | NaN | NaN | 0.0 |
5 rows × 32 columns
In [7]:
df2.head()
Out[7]:
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | ... | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
주요재무정보 | 매출액 | 영업이익 | 영업이익(발표기준) | 세전계속사업이익 | 당기순이익 | 당기순이익(지배) | 당기순이익(비지배) | 자산총계 | 부채총계 | 자본총계 | ... | ROA(%) | 부채비율 | 자본유보율 | EPS(원) | PER(배) | BPS(원) | PBR(배) | 현금DPS(원) | 현금배당수익률 | 현금배당성향(%) |
2019/09\n(IFRS연결) | 4055.0 | 1392.0 | 1392.0 | 1554.0 | 1286.0 | 1286.0 | 0.0 | 41698.0 | 4781.0 | 36917.0 | ... | 7.2 | 12.95 | 3513.86 | 601.0 | 21.0 | 18209.0 | 1.62 | 0.0 | NaN | 0.0 |
2019/12\n(IFRS연결) | 3728.0 | 641.0 | 641.0 | 769.0 | 526.0 | 526.0 | 0.0 | 44381.0 | 7204.0 | 37178.0 | ... | 7.72 | 19.38 | 3538.24 | 246.0 | 18.92 | 18337.0 | 1.61 | 900.0 | NaN | 346.75 |
2020/03\n(IFRS연결) | 2360.0 | -1868.0 | -1868.0 | -2204.0 | -1561.0 | -1561.0 | 0.0 | 43702.0 | 9945.0 | 33757.0 | ... | 1.75 | 29.46 | 3218.48 | -730.0 | 55.53 | 16650.0 | 1.19 | NaN | NaN | NaN |
2020/06\n(IFRS연결) | 346.0 | -1038.0 | -1038.0 | -723.0 | -456.0 | -456.0 | 0.0 | 39178.0 | 5900.0 | 33277.0 | ... | -0.5 | 17.73 | 3173.64 | -213.0 | NaN | 16414.0 | 1.31 | NaN | NaN | 0.0 |
5 rows × 32 columns
In [10]:
# 0번째 row에 있는 컬럼명 df_columns 변수 저장
df_columns=df1.iloc[0]
#헤더 index 이를 컬럼명으로 바꾼다
df1.columns=df_columns
df2.columns=df_columns
In [12]:
df1
Out[12]:
주요재무정보 | 매출액 | 영업이익 | 영업이익(발표기준) | 세전계속사업이익 | 당기순이익 | 당기순이익(지배) | 당기순이익(비지배) | 자산총계 | 부채총계 | 자본총계 | ... | ROA(%) | 부채비율 | 자본유보율 | EPS(원) | PER(배) | BPS(원) | PBR(배) | 현금DPS(원) | 현금배당수익률 | 현금배당성향(%) |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
주요재무정보 | 매출액 | 영업이익 | 영업이익(발표기준) | 세전계속사업이익 | 당기순이익 | 당기순이익(지배) | 당기순이익(비지배) | 자산총계 | 부채총계 | 자본총계 | ... | ROA(%) | 부채비율 | 자본유보율 | EPS(원) | PER(배) | BPS(원) | PBR(배) | 현금DPS(원) | 현금배당수익률 | 현금배당성향(%) |
2019/09\n(IFRS연결) | 14753.0 | 574.0 | 574.0 | 376.0 | 274.0 | 277.0 | -3.0 | 37747.0 | 28854.0 | 8893.0 | ... | 3.62 | 324.45 | 395.1 | 692.0 | 31.19 | 23484.0 | 3.67 | 0.0 | NaN | 0.0 |
2019/12\n(IFRS연결) | 15440.0 | 776.0 | 776.0 | 538.0 | 380.0 | 380.0 | 0.0 | 35273.0 | 26077.0 | 9195.0 | ... | 5.81 | 283.59 | 411.78 | 950.0 | 21.4 | 24282.0 | 3.74 | 350.0 | NaN | 34.94 |
2020/03\n(IFRS연결) | 9437.0 | -668.0 | -668.0 | -925.0 | -736.0 | -736.0 | 0.0 | 33188.0 | 24813.0 | 8375.0 | ... | 1.25 | 296.28 | 368.36 | -1839.0 | 63.76 | 22114.0 | 3.19 | NaN | NaN | 0.0 |
2020/06\n(IFRS연결) | 5230.0 | -634.0 | -634.0 | -819.0 | -677.0 | -678.0 | 1.0 | 33039.0 | 25364.0 | 7676.0 | ... | -2.14 | 330.45 | 334.46 | -1695.0 | NaN | 20265.0 | 3.5 | NaN | NaN | 0.0 |
2020/09\n(IFRS연결) | 8795.0 | -198.0 | -198.0 | -366.0 | -285.0 | -285.0 | 0.0 | 32683.0 | 25318.0 | 7365.0 | ... | -3.74 | 343.77 | 320.21 | -712.0 | NaN | 19444.0 | 3.91 | NaN | NaN | NaN |
2020/12(E)\n(IFRS연결) | 9980.0 | 50.0 | NaN | -109.0 | -100.0 | -100.0 | NaN | 32388.0 | 25171.0 | 7216.0 | ... | NaN | 348.79 | NaN | -251.0 | NaN | 19187.0 | 4.22 | NaN | NaN | NaN |
2021/03(E)\n(IFRS연결) | 9761.0 | 144.0 | NaN | 14.0 | 71.0 | 53.0 | NaN | NaN | NaN | NaN | ... | NaN | NaN | NaN | 133.0 | NaN | NaN | NaN | NaN | NaN | NaN |
2021/06(E)\n(IFRS연결) | 9820.0 | 265.0 | NaN | 172.0 | 214.0 | 123.0 | NaN | NaN | NaN | NaN | ... | NaN | NaN | NaN | 308.0 | NaN | NaN | NaN | NaN | NaN | NaN |
9 rows × 32 columns
In [14]:
# 헤더에 컬럼명 들어갔으니 0번째 행 필요없음
# 슬라이싱 - 0번재 말고 나머지만 추출
df1=df1[1:]
df2=df2[1:]
In [16]:
df1.head()
Out[16]:
주요재무정보 | 매출액 | 영업이익 | 영업이익(발표기준) | 세전계속사업이익 | 당기순이익 | 당기순이익(지배) | 당기순이익(비지배) | 자산총계 | 부채총계 | 자본총계 | ... | ROA(%) | 부채비율 | 자본유보율 | EPS(원) | PER(배) | BPS(원) | PBR(배) | 현금DPS(원) | 현금배당수익률 | 현금배당성향(%) |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2019/09\n(IFRS연결) | 14753.0 | 574.0 | 574.0 | 376.0 | 274.0 | 277.0 | -3.0 | 37747.0 | 28854.0 | 8893.0 | ... | 3.62 | 324.45 | 395.1 | 692.0 | 31.19 | 23484.0 | 3.67 | 0.0 | NaN | 0.0 |
2019/12\n(IFRS연결) | 15440.0 | 776.0 | 776.0 | 538.0 | 380.0 | 380.0 | 0.0 | 35273.0 | 26077.0 | 9195.0 | ... | 5.81 | 283.59 | 411.78 | 950.0 | 21.4 | 24282.0 | 3.74 | 350.0 | NaN | 34.94 |
2020/03\n(IFRS연결) | 9437.0 | -668.0 | -668.0 | -925.0 | -736.0 | -736.0 | 0.0 | 33188.0 | 24813.0 | 8375.0 | ... | 1.25 | 296.28 | 368.36 | -1839.0 | 63.76 | 22114.0 | 3.19 | NaN | NaN | 0.0 |
2020/06\n(IFRS연결) | 5230.0 | -634.0 | -634.0 | -819.0 | -677.0 | -678.0 | 1.0 | 33039.0 | 25364.0 | 7676.0 | ... | -2.14 | 330.45 | 334.46 | -1695.0 | NaN | 20265.0 | 3.5 | NaN | NaN | 0.0 |
2020/09\n(IFRS연결) | 8795.0 | -198.0 | -198.0 | -366.0 | -285.0 | -285.0 | 0.0 | 32683.0 | 25318.0 | 7365.0 | ... | -3.74 | 343.77 | 320.21 | -712.0 | NaN | 19444.0 | 3.91 | NaN | NaN | NaN |
5 rows × 32 columns
In [17]:
df2.head()
Out[17]:
주요재무정보 | 매출액 | 영업이익 | 영업이익(발표기준) | 세전계속사업이익 | 당기순이익 | 당기순이익(지배) | 당기순이익(비지배) | 자산총계 | 부채총계 | 자본총계 | ... | ROA(%) | 부채비율 | 자본유보율 | EPS(원) | PER(배) | BPS(원) | PBR(배) | 현금DPS(원) | 현금배당수익률 | 현금배당성향(%) |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2019/09\n(IFRS연결) | 4055.0 | 1392.0 | 1392.0 | 1554.0 | 1286.0 | 1286.0 | 0.0 | 41698.0 | 4781.0 | 36917.0 | ... | 7.2 | 12.95 | 3513.86 | 601.0 | 21.0 | 18209.0 | 1.62 | 0.0 | NaN | 0.0 |
2019/12\n(IFRS연결) | 3728.0 | 641.0 | 641.0 | 769.0 | 526.0 | 526.0 | 0.0 | 44381.0 | 7204.0 | 37178.0 | ... | 7.72 | 19.38 | 3538.24 | 246.0 | 18.92 | 18337.0 | 1.61 | 900.0 | NaN | 346.75 |
2020/03\n(IFRS연결) | 2360.0 | -1868.0 | -1868.0 | -2204.0 | -1561.0 | -1561.0 | 0.0 | 43702.0 | 9945.0 | 33757.0 | ... | 1.75 | 29.46 | 3218.48 | -730.0 | 55.53 | 16650.0 | 1.19 | NaN | NaN | NaN |
2020/06\n(IFRS연결) | 346.0 | -1038.0 | -1038.0 | -723.0 | -456.0 | -456.0 | 0.0 | 39178.0 | 5900.0 | 33277.0 | ... | -0.5 | 17.73 | 3173.64 | -213.0 | NaN | 16414.0 | 1.31 | NaN | NaN | 0.0 |
2020/09\n(IFRS연결) | 766.0 | -649.0 | -649.0 | -552.0 | -409.0 | -409.0 | 0.0 | 37434.0 | 4560.0 | 32875.0 | ... | -4.8 | 13.87 | 3136.0 | -191.0 | NaN | 16215.0 | 1.33 | NaN | NaN | NaN |
5 rows × 32 columns
In [18]:
df1.shape
Out[18]:
(8, 32)
In [19]:
df2.shape
Out[19]:
(8, 32)
In [20]:
# 결측치 확인 - fillna() 결측치 0으로 대체
# df1의 -1 번쨰 컬럼의 결측치 몇개?
df1.iloc[:, -1].isnull().sum()
Out[20]:
4
In [21]:
df2.iloc[:,-1].isnull().sum()
Out[21]:
5
In [22]:
#결측치 -0
df1=df1.fillna(0)
df2=df2.fillna(0)
In [23]:
df1.isnull().sum()
Out[23]:
주요재무정보
매출액 0
영업이익 0
영업이익(발표기준) 0
세전계속사업이익 0
당기순이익 0
당기순이익(지배) 0
당기순이익(비지배) 0
자산총계 0
부채총계 0
자본총계 0
자본총계(지배) 0
자본총계(비지배) 0
자본금 0
영업활동현금흐름 0
투자활동현금흐름 0
재무활동현금흐름 0
CAPEX 0
FCF 0
이자발생부채 0
영업이익률 0
순이익률 0
ROE(%) 0
ROA(%) 0
부채비율 0
자본유보율 0
EPS(원) 0
PER(배) 0
BPS(원) 0
PBR(배) 0
현금DPS(원) 0
현금배당수익률 0
현금배당성향(%) 0
dtype: int64
In [24]:
df2.isnull().sum()
Out[24]:
주요재무정보
매출액 0
영업이익 0
영업이익(발표기준) 0
세전계속사업이익 0
당기순이익 0
당기순이익(지배) 0
당기순이익(비지배) 0
자산총계 0
부채총계 0
자본총계 0
자본총계(지배) 0
자본총계(비지배) 0
자본금 0
영업활동현금흐름 0
투자활동현금흐름 0
재무활동현금흐름 0
CAPEX 0
FCF 0
이자발생부채 0
영업이익률 0
순이익률 0
ROE(%) 0
ROA(%) 0
부채비율 0
자본유보율 0
EPS(원) 0
PER(배) 0
BPS(원) 0
PBR(배) 0
현금DPS(원) 0
현금배당수익률 0
현금배당성향(%) 0
dtype: int64
In [26]:
# 자산총계 결측치 처리- imputation
#데이터 새 변수 저장
df1_re=pd.read_excel(url, sheet_name=0)
df2_re=pd.read_excel(url, sheet_name=1)
In [29]:
df1_re=df1_re.T
df2_re=df2_re.T
df1_re.columns=df_columns
df2_re.columns=df_columns
df1_re = df1_re[1:]
df2_re = df2_re[1:]
In [30]:
#자산총계 평균값
df1['자산총계'].mean()
Out[30]:
25539.75
In [31]:
df2['자산총계'].mean()
Out[31]:
30583.0
In [33]:
#자산총계 컬럼의 결측치를 평균값으로 대체
df1_re['자산총계']=df1_re['자산총계'].fillna(df1['자산총계'].mean())
df1_re['자산총계']
Out[33]:
2019/09\n(IFRS연결) 37747.00
2019/12\n(IFRS연결) 35273.00
2020/03\n(IFRS연결) 33188.00
2020/06\n(IFRS연결) 33039.00
2020/09\n(IFRS연결) 32683.00
2020/12(E)\n(IFRS연결) 32388.00
2021/03(E)\n(IFRS연결) 25539.75
2021/06(E)\n(IFRS연결) 25539.75
Name: 자산총계, dtype: float64
In [35]:
df2_re['자산총계']=df2_re['자산총계'].fillna(df2['자산총계'].mean())
df2_re['자산총계']
Out[35]:
2019/09\n(IFRS연결) 41698.0
2019/12\n(IFRS연결) 44381.0
2020/03\n(IFRS연결) 43702.0
2020/06\n(IFRS연결) 39178.0
2020/09\n(IFRS연결) 37434.0
2020/12(E)\n(IFRS연결) 38271.0
2021/03(E)\n(IFRS연결) 30583.0
2021/06(E)\n(IFRS연결) 30583.0
Name: 자산총계, dtype: float64
In [36]:
# 부채비율2라는 새로운 피쳐 생성
'''
부채비율(%)=(부채총액/자본총액)*100
'''
# 부채비율2 컬럼 생성, 생성한 컬럼과 기존 부채비율 컬럼의 값이 동일한지 확인
df1['부채비율2']=(df1['부채총계']/df1['자본총계'])*100
df1
Out[36]:
주요재무정보 | 매출액 | 영업이익 | 영업이익(발표기준) | 세전계속사업이익 | 당기순이익 | 당기순이익(지배) | 당기순이익(비지배) | 자산총계 | 부채총계 | 자본총계 | ... | 부채비율 | 자본유보율 | EPS(원) | PER(배) | BPS(원) | PBR(배) | 현금DPS(원) | 현금배당수익률 | 현금배당성향(%) | 부채비율2 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2019/09\n(IFRS연결) | 14753.0 | 574.0 | 574.0 | 376.0 | 274.0 | 277.0 | -3.0 | 37747.0 | 28854.0 | 8893.0 | ... | 324.45 | 395.10 | 692.0 | 31.19 | 23484.0 | 3.67 | 0.0 | 0 | 0.00 | 324.457438 |
2019/12\n(IFRS연결) | 15440.0 | 776.0 | 776.0 | 538.0 | 380.0 | 380.0 | 0.0 | 35273.0 | 26077.0 | 9195.0 | ... | 283.59 | 411.78 | 950.0 | 21.40 | 24282.0 | 3.74 | 350.0 | 0 | 34.94 | 283.599782 |
2020/03\n(IFRS연결) | 9437.0 | -668.0 | -668.0 | -925.0 | -736.0 | -736.0 | 0.0 | 33188.0 | 24813.0 | 8375.0 | ... | 296.28 | 368.36 | -1839.0 | 63.76 | 22114.0 | 3.19 | 0.0 | 0 | 0.00 | 296.274627 |
2020/06\n(IFRS연결) | 5230.0 | -634.0 | -634.0 | -819.0 | -677.0 | -678.0 | 1.0 | 33039.0 | 25364.0 | 7676.0 | ... | 330.45 | 334.46 | -1695.0 | 0.00 | 20265.0 | 3.50 | 0.0 | 0 | 0.00 | 330.432517 |
2020/09\n(IFRS연결) | 8795.0 | -198.0 | -198.0 | -366.0 | -285.0 | -285.0 | 0.0 | 32683.0 | 25318.0 | 7365.0 | ... | 343.77 | 320.21 | -712.0 | 0.00 | 19444.0 | 3.91 | 0.0 | 0 | 0.00 | 343.761032 |
2020/12(E)\n(IFRS연결) | 9980.0 | 50.0 | 0.0 | -109.0 | -100.0 | -100.0 | 0.0 | 32388.0 | 25171.0 | 7216.0 | ... | 348.79 | 0.00 | -251.0 | 0.00 | 19187.0 | 4.22 | 0.0 | 0 | 0.00 | 348.822062 |
2021/03(E)\n(IFRS연결) | 9761.0 | 144.0 | 0.0 | 14.0 | 71.0 | 53.0 | 0.0 | 0.0 | 0.0 | 0.0 | ... | 0.00 | 0.00 | 133.0 | 0.00 | 0.0 | 0.00 | 0.0 | 0 | 0.00 | NaN |
2021/06(E)\n(IFRS연결) | 9820.0 | 265.0 | 0.0 | 172.0 | 214.0 | 123.0 | 0.0 | 0.0 | 0.0 | 0.0 | ... | 0.00 | 0.00 | 308.0 | 0.00 | 0.0 | 0.00 | 0.0 | 0 | 0.00 | NaN |
8 rows × 33 columns
In [37]:
df2['부채비율2']=(df2['부채총계']/df2['자본총계'])*100
df2
Out[37]:
주요재무정보 | 매출액 | 영업이익 | 영업이익(발표기준) | 세전계속사업이익 | 당기순이익 | 당기순이익(지배) | 당기순이익(비지배) | 자산총계 | 부채총계 | 자본총계 | ... | 부채비율 | 자본유보율 | EPS(원) | PER(배) | BPS(원) | PBR(배) | 현금DPS(원) | 현금배당수익률 | 현금배당성향(%) | 부채비율2 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2019/09\n(IFRS연결) | 4055.0 | 1392.0 | 1392.0 | 1554.0 | 1286.0 | 1286.0 | 0.0 | 41698.0 | 4781.0 | 36917.0 | ... | 12.95 | 3513.86 | 601.0 | 21.00 | 18209.0 | 1.62 | 0.0 | 0 | 0.00 | 12.950673 |
2019/12\n(IFRS연결) | 3728.0 | 641.0 | 641.0 | 769.0 | 526.0 | 526.0 | 0.0 | 44381.0 | 7204.0 | 37178.0 | ... | 19.38 | 3538.24 | 246.0 | 18.92 | 18337.0 | 1.61 | 900.0 | 0 | 346.75 | 19.377051 |
2020/03\n(IFRS연결) | 2360.0 | -1868.0 | -1868.0 | -2204.0 | -1561.0 | -1561.0 | 0.0 | 43702.0 | 9945.0 | 33757.0 | ... | 29.46 | 3218.48 | -730.0 | 55.53 | 16650.0 | 1.19 | 0.0 | 0 | 0.00 | 29.460556 |
2020/06\n(IFRS연결) | 346.0 | -1038.0 | -1038.0 | -723.0 | -456.0 | -456.0 | 0.0 | 39178.0 | 5900.0 | 33277.0 | ... | 17.73 | 3173.64 | -213.0 | 0.00 | 16414.0 | 1.31 | 0.0 | 0 | 0.00 | 17.729964 |
2020/09\n(IFRS연결) | 766.0 | -649.0 | -649.0 | -552.0 | -409.0 | -409.0 | 0.0 | 37434.0 | 4560.0 | 32875.0 | ... | 13.87 | 3136.00 | -191.0 | 0.00 | 16215.0 | 1.33 | 0.0 | 0 | 0.00 | 13.870722 |
2020/12(E)\n(IFRS연결) | 1581.0 | -434.0 | 0.0 | -331.0 | -465.0 | -314.0 | 0.0 | 38271.0 | 5998.0 | 32274.0 | ... | 18.58 | 0.00 | -147.0 | 0.00 | 15888.0 | 1.46 | 0.0 | 0 | 0.00 | 18.584619 |
2021/03(E)\n(IFRS연결) | 1473.0 | -187.0 | 0.0 | 0.0 | 0.0 | -33.0 | 0.0 | 0.0 | 0.0 | 0.0 | ... | 0.00 | 0.00 | -15.0 | 0.00 | 0.0 | 0.00 | 0.0 | 0 | 0.00 | NaN |
2021/06(E)\n(IFRS연결) | 1746.0 | -65.0 | 0.0 | 0.0 | 0.0 | 135.0 | 0.0 | 0.0 | 0.0 | 0.0 | ... | 0.00 | 0.00 | 63.0 | 0.00 | 0.0 | 0.00 | 0.0 | 0 | 0.00 | NaN |
8 rows × 33 columns
In [38]:
# 종목이라는 새로운 피쳐 생성
# .repeat()활용해 새로운 컬럼생성- 각 데이터프레임에 종목이라는 컬럼 만들고 df1, df2를 합치기
import numpy as np
df1_new=np.repeat('008770', len(df1))
df2_new=np.repeat('035250', len(df2))
In [39]:
#종목생성
df2['종목']=df1_new
df1['종목']=df2_new
In [40]:
#데이터 프레임 합치기
df=df1.append(df2)
df
C:\Users\Public\Documents\ESTsoft\CreatorTemp\ipykernel_15700\2053012206.py:2: FutureWarning: The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.
df=df1.append(df2)
Out[40]:
주요재무정보 | 매출액 | 영업이익 | 영업이익(발표기준) | 세전계속사업이익 | 당기순이익 | 당기순이익(지배) | 당기순이익(비지배) | 자산총계 | 부채총계 | 자본총계 | ... | 자본유보율 | EPS(원) | PER(배) | BPS(원) | PBR(배) | 현금DPS(원) | 현금배당수익률 | 현금배당성향(%) | 부채비율2 | 종목 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2019/09\n(IFRS연결) | 14753.0 | 574.0 | 574.0 | 376.0 | 274.0 | 277.0 | -3.0 | 37747.0 | 28854.0 | 8893.0 | ... | 395.10 | 692.0 | 31.19 | 23484.0 | 3.67 | 0.0 | 0 | 0.00 | 324.457438 | 035250 |
2019/12\n(IFRS연결) | 15440.0 | 776.0 | 776.0 | 538.0 | 380.0 | 380.0 | 0.0 | 35273.0 | 26077.0 | 9195.0 | ... | 411.78 | 950.0 | 21.40 | 24282.0 | 3.74 | 350.0 | 0 | 34.94 | 283.599782 | 035250 |
2020/03\n(IFRS연결) | 9437.0 | -668.0 | -668.0 | -925.0 | -736.0 | -736.0 | 0.0 | 33188.0 | 24813.0 | 8375.0 | ... | 368.36 | -1839.0 | 63.76 | 22114.0 | 3.19 | 0.0 | 0 | 0.00 | 296.274627 | 035250 |
2020/06\n(IFRS연결) | 5230.0 | -634.0 | -634.0 | -819.0 | -677.0 | -678.0 | 1.0 | 33039.0 | 25364.0 | 7676.0 | ... | 334.46 | -1695.0 | 0.00 | 20265.0 | 3.50 | 0.0 | 0 | 0.00 | 330.432517 | 035250 |
2020/09\n(IFRS연결) | 8795.0 | -198.0 | -198.0 | -366.0 | -285.0 | -285.0 | 0.0 | 32683.0 | 25318.0 | 7365.0 | ... | 320.21 | -712.0 | 0.00 | 19444.0 | 3.91 | 0.0 | 0 | 0.00 | 343.761032 | 035250 |
2020/12(E)\n(IFRS연결) | 9980.0 | 50.0 | 0.0 | -109.0 | -100.0 | -100.0 | 0.0 | 32388.0 | 25171.0 | 7216.0 | ... | 0.00 | -251.0 | 0.00 | 19187.0 | 4.22 | 0.0 | 0 | 0.00 | 348.822062 | 035250 |
2021/03(E)\n(IFRS연결) | 9761.0 | 144.0 | 0.0 | 14.0 | 71.0 | 53.0 | 0.0 | 0.0 | 0.0 | 0.0 | ... | 0.00 | 133.0 | 0.00 | 0.0 | 0.00 | 0.0 | 0 | 0.00 | NaN | 035250 |
2021/06(E)\n(IFRS연결) | 9820.0 | 265.0 | 0.0 | 172.0 | 214.0 | 123.0 | 0.0 | 0.0 | 0.0 | 0.0 | ... | 0.00 | 308.0 | 0.00 | 0.0 | 0.00 | 0.0 | 0 | 0.00 | NaN | 035250 |
2019/09\n(IFRS연결) | 4055.0 | 1392.0 | 1392.0 | 1554.0 | 1286.0 | 1286.0 | 0.0 | 41698.0 | 4781.0 | 36917.0 | ... | 3513.86 | 601.0 | 21.00 | 18209.0 | 1.62 | 0.0 | 0 | 0.00 | 12.950673 | 008770 |
2019/12\n(IFRS연결) | 3728.0 | 641.0 | 641.0 | 769.0 | 526.0 | 526.0 | 0.0 | 44381.0 | 7204.0 | 37178.0 | ... | 3538.24 | 246.0 | 18.92 | 18337.0 | 1.61 | 900.0 | 0 | 346.75 | 19.377051 | 008770 |
2020/03\n(IFRS연결) | 2360.0 | -1868.0 | -1868.0 | -2204.0 | -1561.0 | -1561.0 | 0.0 | 43702.0 | 9945.0 | 33757.0 | ... | 3218.48 | -730.0 | 55.53 | 16650.0 | 1.19 | 0.0 | 0 | 0.00 | 29.460556 | 008770 |
2020/06\n(IFRS연결) | 346.0 | -1038.0 | -1038.0 | -723.0 | -456.0 | -456.0 | 0.0 | 39178.0 | 5900.0 | 33277.0 | ... | 3173.64 | -213.0 | 0.00 | 16414.0 | 1.31 | 0.0 | 0 | 0.00 | 17.729964 | 008770 |
2020/09\n(IFRS연결) | 766.0 | -649.0 | -649.0 | -552.0 | -409.0 | -409.0 | 0.0 | 37434.0 | 4560.0 | 32875.0 | ... | 3136.00 | -191.0 | 0.00 | 16215.0 | 1.33 | 0.0 | 0 | 0.00 | 13.870722 | 008770 |
2020/12(E)\n(IFRS연결) | 1581.0 | -434.0 | 0.0 | -331.0 | -465.0 | -314.0 | 0.0 | 38271.0 | 5998.0 | 32274.0 | ... | 0.00 | -147.0 | 0.00 | 15888.0 | 1.46 | 0.0 | 0 | 0.00 | 18.584619 | 008770 |
2021/03(E)\n(IFRS연결) | 1473.0 | -187.0 | 0.0 | 0.0 | 0.0 | -33.0 | 0.0 | 0.0 | 0.0 | 0.0 | ... | 0.00 | -15.0 | 0.00 | 0.0 | 0.00 | 0.0 | 0 | 0.00 | NaN | 008770 |
2021/06(E)\n(IFRS연결) | 1746.0 | -65.0 | 0.0 | 0.0 | 0.0 | 135.0 | 0.0 | 0.0 | 0.0 | 0.0 | ... | 0.00 | 63.0 | 0.00 | 0.0 | 0.00 | 0.0 | 0 | 0.00 | NaN | 008770 |
16 rows × 34 columns
In [ ]:
'데이터 분석 및 프로젝트' 카테고리의 다른 글
SELECT 문 실행 순서 / CASE/ SUBQUERY/IN NOT IN /FROM (0) | 2023.05.23 |
---|---|
SQL 내장 함수 (0) | 2023.05.23 |
아우디 중고차 가격 예측하기 - 머신러닝 (0) | 2023.05.10 |
section1 project- 비디오 게임 데이터 분석 (0) | 2023.03.13 |
CLT - N122 (0) | 2023.02.25 |